指令微调 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

阿里史上最大规模开源发布，超GPT-4o 、Llama-3.1！

阿里巴巴于今日宣布了其史上最庞大的开源项目，推出了包括Qwen2.5、Qwen2.5-Coder和Qwen2.5-Math在内的三大基础模型系列，共计十多个版本，涵盖从0.5B到72B的不同参数量级，以适应个人、企业及移动端、PC等不同需求场景。阿里还提供了旗舰模型Qwen-Plus和Qwen-Tu...

原文链接

AI创意引擎

09-19 18:56:00

基础模型Qwen2.5

指令微调模型

阿里巴巴

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI 把 GPT-4 原始版给了瑞士洛桑联邦理工团队：研究不微调只靠提示词能走多远

瑞士洛桑联邦理工（EPFL）团队获得了OpenAI的GPT-4-Base原始版本，进行一项独特研究，探索未经过微调的大模型仅依赖提示词能否实现有效对话和指令遵循。他们挑战现有技术，如URIAL，但发现即便使用增加示例和贪心搜索，模型与指令微调模型间的差距依然明显，尤其是在多轮对话中。研究揭示了示例选择对模型的重要性，以及大语言模型可能只是模仿而非真正理解指令逻辑。结论指出，尽管尝试了多种方法，上下文学习缩小与指令微调差距仍有挑战，AI助手的听话程度短期内不易提升。

原文链接