综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
11月13日,据财联社报道,全球AI模型排行榜LMArena最新发布编程与代码生成模型排名(Coding Arena),美国Anthropic的Claude、GPT-5与中国智谱GLM-4.6并列全球第一。Coding模型专为编程任务优化,可帮助开发者高效编写、调试和优化代码,已成为全球科技巨头与初创企业的战略焦点。这一排名反映了当前AI在编程领域的顶尖水平,显示出中美两国在AI技术上的强劲竞争力。(澎湃新闻)
原文链接
2025年10月5日,腾讯混元图像3.0登顶全球AI文生图榜单首位,超越谷歌Nano Banana、字节Seedream等强劲对手,在国际权威竞技场LMArena的26个大模型中稳居第一。该模型采用原生多模态架构,参数规模达80B,是目前最大的开源生图模型,支持文字、图片、视频与音频多模态处理。其语义理解能力大幅提升,可生成高质量图像,如中秋节海报、火焰猫咪等创意作品,并在多项技术指标上领先行业。此外,混元3.0开源且提供多种资源链接,引发全民体验热潮,热度持续飙升。
原文链接
10月5日,腾讯混元图像3.0模型在国际大模型竞技场LMArena的文生图榜单中,凭借全球用户的“盲测”投票,超越26个顶尖模型荣登第一。LMArena由美国加州大学伯克利分校推出,采用基于人类真实偏好的匿名投票机制,是目前最权威的AI模型评估平台之一。混元图像3.0于9月28日发布,现已开放文生图能力,并计划后续推出图生图、图像编辑等功能。该模型不仅能生成复杂文本、漫画、表情包和科普插画,还能大幅提升视觉创作者效率,使无美术功底的用户也能轻松创作生动内容。
原文链接
近日,AI大模型排行榜LMArena被曝出可能存在作弊刷分行为,多家机构联合发表论文指控少数大厂利用漏洞操纵排名。论文指出,Meta等公司在测试阶段筛选最优模型,导致排行榜结果失真。OpenAI创始人Andrej Karpathy也分享个人体验,质疑某些模型排名与其实际表现不符。LMArena回应称论文存在事实错误,强调其政策公开透明,并反对将预发布模型纳入排名。事件引发对榜单公信力的广泛讨论,有人建议转向新平台OpenRouterAI,以更真实反映模型性能。LMArena由高校学生发起,初衷虽佳,但随着管理权交接,透明性和公平性受到挑战。此事件发生在LMArena筹备融资之际,可能对其未来发展产生影响。
原文链接
加载更多
暂无内容