1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

中国电信于1月25日发布“复杂推理大模型”TeleAI-t1-preview,该模型在美国数学竞赛AIME 2024及MATH500评测中分别取得60和93.8分,大幅超越OpenAI o1-preview、GPT-4o等标杆模型。在GPQA Diamond测试中,TeleAI-t1-preview得分超过GPT-4o,接近Claude 3.5 Sonnet的表现。TeleAI-t1-preview不仅能解决《九章算术》中的题目,还能进行古今单位换算,并结合形象思维与抽象思维进行推理。该模型采用了创新的训练策略,包括高质量推理数据集构建、Judge Model评估、SFT阶段的高质量长推理数据生成及强化学习阶段的Rule-based Reward Model应用。

原文链接
本文链接:https://kx.umi6.com/article/12183.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
2024-11-28 10:23:25
MIT 新研究指出 AI 不懂“no”,逻辑推理缺陷导致否定词成“盲区”
2025-05-22 09:22:19
两句话,让LLM逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出GPT、Claude等重大缺陷
2024-06-10 21:37:45
两句话,让 LLM 逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出 GPT、Claude 等重大缺陷
2024-06-10 18:37:26
TeleAI “复杂推理大模型” 达竞赛级数学表现,评分超 o1-preview
2025-01-26 17:15:51
大语言模型会推理吗?
2024-11-13 11:33:40
月薪高达13万元!科技大厂掀起AI人才争夺战:35岁从业者成抢手资源
2026-06-08 12:26:28
有余凯不投的地平线离职创业员工吗?
2026-06-07 21:50:41
2026年全国统一高考今天开考:新增AI监考员、智能眼镜带入即作弊
2026-06-07 07:21:05
智源&清华合作成果登上Science:脑科学多模态基础模型Brainμ支撑揭示“记忆-睡眠”调控的神经机制
2026-06-05 19:13:44
扣子3.0实测:手机就能远程遥控你电脑里的Agent
2026-06-04 09:58:01
NUS 余浩泳教授:外骨骼的轻量化与任务感知丨ICRA 2026
2026-06-03 17:35:24
今年CVPR看点是广东:何恺明再获至高大奖,广工大打破大厂名校垄断
2026-06-06 15:50:06
24小时热文
更多
扫一扫体验小程序