
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤
AI社区掀起用大模型玩游戏的热潮!例如,国外博主让DeepSeek和Chatgpt下国际象棋的视频在YouTube上收获百万播放量,ARC Prize也发布了贪吃蛇LLM评测基准SnakeBench。
港大、剑...
原文链接
27个大模型混战电商领域,DeepSeek-R1&V3仍是最强
首个聚焦电商基础概念的可扩展问答基准ChineseEcomQA发布,由淘天集团推出。传统基准难以兼顾电商任务多样性和领域特殊性,而大模型常因生成事实性错误信息受限制。ChineseEcomQA针对性设计三大核心:基础概念覆盖...
原文链接
加载更多

暂无内容