标题:TeleAI“复杂推理大模型”达竞赛级数学表现,评分超o1-preview
近日,中国电信人工智能研究院(TeleAI)发布“复杂推理大模型”TeleAI-t1-preview,即将上线天翼AI开放平台。该模型采用强化学习训练,通过引入探索和反思等思考范式,显著提升了其在数学推导和逻辑推理等方面的准确性。
早在1500多年前,数学家祖冲之指出复杂事物可通过实际观测和数据推理求得。TeleAI-t1-preview在多项权威数学评测中表现优异,如AIME 2024和MATH500竞赛,分别获得60和93.8分,超越OpenAI o1-preview和GPT-4o等标杆模型。
模型不仅给出正确答案,还展示了完整的思考和分析过程,有助于学生深入理解题目背后的逻辑。例如,在解答涉及“泊松分布”的概率论考研试题时,TeleAI-t1-preview不仅介绍了概念,还提供了详细解题思路和答案。
TeleAI-t1-preview还能处理古代数学难题,如《九章算术》中的题目。它能理解并简化文言文,转换成现代汉语,进行数学推导并给出答案。此外,它在策略推理问题上表现出色,能快速理解游戏规则并提出有效的解题策略。
为了保障推理的有效性,TeleAI引入了创新的训练策略,包括构建高质量推理数据集、训练评估模型(Judge Model)、监督微调(SFT)阶段的MCTS构造数据,以及强化学习阶段的Rule-based Reward Model。这些措施使得模型的推理过程更加准确和透明。
原文链接
本文链接:https://kx.umi6.com/article/12206.html
转载请注明文章出处
相关推荐
.png)
换一换
2025上半年,AI Agent领域有什么变化和机会?
2025-07-11 08:33:06
DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能
2025-05-01 13:22:40
非技术人10分钟读懂Deepseek R1
2025-02-14 18:44:39
430 文章
61877 浏览
24小时热文
更多

-
2025-07-21 18:22:40
-
2025-07-21 18:21:33
-
2025-07-21 18:20:19