综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年1月,大模型评估平台LMArena宣布完成1.5亿美元A轮融资,估值达17亿美元,由Felicis和UC Investments领投。LMArena起源于Chatbot Arena,最初由开源组织LMSYS创建,核心成员多为华人学霸。其评估模式基于匿名对战、Elo评分和人机协同框架,用户通过投票选出更优模型回答,确保公平客观。平台已累计5000万张投票,评估400余种模型,并生成14.5万个开源数据点。此前,LMArena于2025年5月获种子轮1亿美元融资,估值6亿美元。新资金将用于提升平台运营和技术团队扩展,巩固其在AI模型评估领域的领先地位。
原文链接
17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤
AI社区掀起用大模型玩游戏的热潮!例如,国外博主让DeepSeek和Chatgpt下国际象棋的视频在YouTube上收获百万播放量,ARC Prize也发布了贪吃蛇LLM评测基准SnakeBench。
港大、剑...
原文链接
27个大模型混战电商领域,DeepSeek-R1&V3仍是最强
首个聚焦电商基础概念的可扩展问答基准ChineseEcomQA发布,由淘天集团推出。传统基准难以兼顾电商任务多样性和领域特殊性,而大模型常因生成事实性错误信息受限制。ChineseEcomQA针对性设计三大核心:基础概念覆盖...
原文链接
加载更多
暂无内容