中国联通宣布对DeepSeek系列模型进行了“自适应慢思考”优化升级,平均节省30%推理计算量。该模型具备多学科、多场景通用推理能力,能自适应不同任务和难度,避免资源浪费。通过难度自适应微调、二次蒸馏及难度自适应强化学习等技术,优化后的模型在不同难度问题上生成的回答长度明显下降,用户体验提升。此次优化是业界首次对DeepSeek系列思维链模型进行此类升级,现已开源。
原文链接
本文链接:https://kx.umi6.com/article/14336.html
转载请注明文章出处
相关推荐
换一换
重庆人工智能创新中心深度适配DeepSeek-R1系列模型
2025-02-17 19:01:28
烽火通信旗下长江计算 G440K V2 服务器实现 DeepSeek 系列模型推理适配和优化
2025-02-07 18:01:48
8岁小学生idea直接变应用,秒哒3.0刚刚把AI应用门槛打没了
2026-05-13 23:02:03
淘天金码奖落幕:20 名超级工程师诞生,推动 AI Native 实践
2026-05-15 07:26:44
腾讯控股:若剔除新AI产品 一季度非国际财务报告准则经营盈利同比增长17%
2026-05-13 18:56:26
国产GPU芯片爆发:只需10年就完成逆袭 不会再依赖美国了
2026-05-14 19:58:27
台积电:AIGC应用与Agent工作流快速成长 正指数性消耗大量Token
2026-05-14 15:45:36
华为云创想者大会主题论坛议程公布:释放Agentic AI新布局
2026-05-15 18:50:40
AI收费后 免费服务会缩水吗 专家:担心并非杞人忧天
2026-05-14 23:06:46
倒计时一周,AIGC峰会嘉宾又上新了!一起来看第三波嘉宾
2026-05-14 00:03:28
腾讯:小程序和AI的整合是未来发展方向
2026-05-13 22:05:28
Anthropic高管:公司90%代码已由AI完成
2026-05-14 19:59:32
市场监管总局:推进互联网+AI监管建设 治理网红食品等问题
2026-05-14 22:05:01
732 文章
611720 浏览
24小时热文
更多
-
2026-05-15 18:51:47 -
2026-05-15 18:50:40 -
2026-05-15 18:49:23