1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2024年12月19日,智源研究院发布了国内外100多个开源和商业闭源的大模型评测结果,涵盖语言、视觉语言、文生图、文生视频、语音语言等多种模态。评测显示,2024年下半年大模型发展更注重综合能力提升与实际应用。语言模型方面,字节跳动的Doubao-pro-32k-preview和百度的ERNIE 4.0 Turbo表现最佳,分别排名第一和第二。

文生视频模型中,国产模型领先全球。视觉语言模型虽开源架构趋同,但表现各异,部分开源模型在图文理解任务上接近头部闭源模型,但仍需提升长尾视觉知识与文字识别能力。

文生图模型中,腾讯Hunyuan Image排名首位,字节跳动Doubao image v2.1和Ideogram 2.0紧随其后。语音语言模型中,阿里巴巴Qwen2-Audio表现最优,香港中文大学&微软WavLLM和清华大学&字节跳动Salmon位列二三。

此外,智源研究院推出FlagEval大模型角斗场和FlagEval Debate,前者支持语言问答、多模态图文理解等自定义评测,后者评估模型的逻辑推理、观点理解和语言表达能力。评测发现,大模型在金融量化交易领域展现了一定潜力,但仍需提高实际代码生成能力。

原文链接
本文链接:https://kx.umi6.com/article/10457.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026
2025-12-22 10:34:39
百度推动大模型与搜推业务融合
2026-03-18 15:35:09
Karpathy 最新发文:别把 AI 当人看,它没欲望也不怕死
2025-11-22 19:29:36
消息称腾讯大模型团队架构调整:前 OpenAI 研究员姚顺雨任要职,校招最高 2 倍薪资挖 AI 人才
2025-12-17 17:57:42
美图吴欣鸿回应大模型竞争:美图应用数据仍在快速增长
2026-02-05 18:05:31
Kimi即将推出新一代万亿大模型:开源王者刷新 去年已超GPT5
2026-01-20 22:33:50
豆包大模型2.0正式发布
2026-02-14 14:23:01
亚马逊云科技发布多款大模型
2025-12-03 14:25:54
真正的AI竞争力,藏在大模型“后训练”这一步
2025-10-13 16:59:55
智谱中标679.8万元水电大模型项目
2025-11-05 20:23:03
百度世界2025将于11月13日在北京举办
2025-10-13 20:03:11
腾讯调整大模型组织架构:姚顺雨加盟,向总裁刘炽平汇报
2025-12-18 15:51:59
中国中文信息学会2025学术年会暨第二届中国大模型大会(CIPS & CLM 2025)于10月28日在北京盛大开幕
2025-10-30 18:52:50
24小时热文
更多
扫一扫体验小程序