1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
给AI打个分,结果搞出17亿估值独角兽???
2026年1月,大模型评估平台LMArena宣布完成1.5亿美元A轮融资,估值达17亿美元,由Felicis和UC Investments领投。LMArena起源于Chatbot Arena,最初由开源组织LMSYS创建,核心成员多为华人学霸。其评估模式基于匿名对战、Elo评分和人机协同框架,用户通过投票选出更优模型回答,确保公平客观。平台已累计5000万张投票,评估400余种模型,并生成14.5万个开源数据点。此前,LMArena于2025年5月获种子轮1亿美元融资,估值6亿美元。新资金将用于提升平台运营和技术团队扩展,巩固其在AI模型评估领域的领先地位。
AGI探路者
01-07 18:23:47
AI独角兽
LMArena
大模型评估
分享至
打开微信扫一扫
内容投诉
生成图片
17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤
17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤 AI社区掀起用大模型玩游戏的热潮!例如,国外博主让DeepSeek和Chatgpt下国际象棋的视频在YouTube上收获百万播放量,ARC Prize也发布了贪吃蛇LLM评测基准SnakeBench。 港大、剑...
WisdomTrail
03-29 13:39:26
GameBoT
中间步骤评测
大模型评估
分享至
打开微信扫一扫
内容投诉
生成图片
27个大模型混战电商领域,DeepSeek-R1&V3仍是最强
27个大模型混战电商领域,DeepSeek-R1&V3仍是最强 首个聚焦电商基础概念的可扩展问答基准ChineseEcomQA发布,由淘天集团推出。传统基准难以兼顾电商任务多样性和领域特殊性,而大模型常因生成事实性错误信息受限制。ChineseEcomQA针对性设计三大核心:基础概念覆盖...
跨界思维
03-15 23:19:30
ChineseEcomQA
大模型评估
电商领域
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序