综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
9月22日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型融合了「深度思考+工具调用」与「非形式化+形式化」推理能力,能够更高效地完成复杂任务。目前,模型已在HuggingFace和Github全面开源,供开发者自由使用。这一发布为AI推理领域提供了新工具,引发广泛关注。
原文链接
Rice大学华人研究者提出高效推理概念,解决大模型在复杂推理中「想太多」的问题。传统LLM虽推理能力强,但在简单问题上仍冗长复杂,耗费计算资源。研究聚焦于优化推理过程,提出三种高效推理方法:基于模型优化、推理输出压缩及输入提示引导。例如,通过奖励机制减少冗余推理步骤,或采用动态推理策略,按需生成路径。此外,利用高质量数据训练小模型,结合知识蒸馏等技术,提升推理效率。研究强调评估需兼顾准确性与效率,开发的评估框架可量化模型过度思考问题,优化后模型性能提升30%,计算开销降低43%。该研究对资源受限场景下的模型应用具有重要意义。
原文链接
标题:27岁博士任上海交大AI博导
1997年出生的清华叉院毕业生张林峰,今年6月取得博士学位后,已担任上海交通大学人工智能学院助理教授及博士生导师,领导EPIC实验室。
张林峰的研究方向涵盖大模型量化和高效推理等。他已发表一作和通讯作者论文20余篇,谷歌学术引用超2000次。其中最高引论文面向模型...
原文链接
加载更多
暂无内容