综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
阿里巴巴于今日宣布了其史上最庞大的开源项目,推出了包括Qwen2.5、Qwen2.5-Coder和Qwen2.5-Math在内的三大基础模型系列,共计十多个版本,涵盖从0.5B到72B的不同参数量级,以适应个人、企业及移动端、PC等不同需求场景。阿里还提供了旗舰模型Qwen-Plus和Qwen-Tu...
原文链接
瑞士洛桑联邦理工(EPFL)团队获得了OpenAI的GPT-4-Base原始版本,进行一项独特研究,探索未经过微调的大模型仅依赖提示词能否实现有效对话和指令遵循。他们挑战现有技术,如URIAL,但发现即便使用增加示例和贪心搜索,模型与指令微调模型间的差距依然明显,尤其是在多轮对话中。研究揭示了示例选择对模型的重要性,以及大语言模型可能只是模仿而非真正理解指令逻辑。结论指出,尽管尝试了多种方法,上下文学习缩小与指令微调差距仍有挑战,AI助手的听话程度短期内不易提升。
原文链接
加载更多
暂无内容