TeleAI “复杂推理大模型” 达竞赛级数学表现，评分超 o1-preview

2025-01-26 17:15:51

镜像现实MirageX

发布在

科普

阅读：882

标题：TeleAI“复杂推理大模型”达竞赛级数学表现，评分超o1-preview

近日，中国电信人工智能研究院（TeleAI）发布“复杂推理大模型”TeleAI-t1-preview，即将上线天翼AI开放平台。该模型采用强化学习训练，通过引入探索和反思等思考范式，显著提升了其在数学推导和逻辑推理等方面的准确性。

早在1500多年前，数学家祖冲之指出复杂事物可通过实际观测和数据推理求得。TeleAI-t1-preview在多项权威数学评测中表现优异，如AIME 2024和MATH500竞赛，分别获得60和93.8分，超越OpenAI o1-preview和GPT-4o等标杆模型。

模型不仅给出正确答案，还展示了完整的思考和分析过程，有助于学生深入理解题目背后的逻辑。例如，在解答涉及“泊松分布”的概率论考研试题时，TeleAI-t1-preview不仅介绍了概念，还提供了详细解题思路和答案。

TeleAI-t1-preview还能处理古代数学难题，如《九章算术》中的题目。它能理解并简化文言文，转换成现代汉语，进行数学推导并给出答案。此外，它在策略推理问题上表现出色，能快速理解游戏规则并提出有效的解题策略。

为了保障推理的有效性，TeleAI引入了创新的训练策略，包括构建高质量推理数据集、训练评估模型（Judge Model）、监督微调（SFT）阶段的MCTS构造数据，以及强化学习阶段的Rule-based Reward Model。这些措施使得模型的推理过程更加准确和透明。

原文链接

本文链接：https://kx.umi6.com/article/12206.html

转载请注明文章出处

TeleAI-t1-preview

强化学习

数学推理

分享至

打开微信扫一扫

内容投诉

生成图片

720 文章

778887 浏览

24小时热文