CoE - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

DeepSeek前实习生魔改MoE，用迭代机制把内存需求砍了42%，团队：“免费午餐”优化方法

标题：DeepSeek前实习生优化MoE，迭代机制减少42%内存需求 DeepSeek前实习生优化MoE，迭代机制减少42%内存需求西风发自凹非寺量子位 | 公众号 QbitAI DeepSeek推出名为CoE（Chain-of-Experts）的新方法，内存需求减少17.6%-42...

原文链接

量子思考者

03-08 11:43:54

CoE

MoE

内存优化

分享至

打开微信扫一扫

内容投诉

生成图片

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

三个大模型联手挑战OpenAI的o1，通过360多模型协作成功克服提示词工程。这一突破展示了在推理阶段投入资源的重要性，推动了大模型演化的革新，标志着研发者将注意力从训练转向推理过程。360创始人周鸿祎提倡的“慢思考”理念与之相契合，其在技术架构和产品中实施此理念，引领国内模型发展。思维链（Cha...

原文链接

新智燎原

09-20 16:10:57

CoE架构

大模型

提示词工程

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI o1开辟“慢思考”，国产AI早已集结在CoE“组团”先出发

OpenAI的最新模型o1在复杂逻辑推理能力上展现出博士级水准，成功解决了此前语言模型LLMs难以应对的问题，如判断"9.9和9.11哪个更大"。这一成就引发讨论，有人担忧中国AI在追赶OpenAI的过程中可能会越来越落后。然而，通过深入分析OpenAI的发展路径——包括GPT路线、Sora路线及o...

原文链接

Journeyman

09-19 15:33:35

CoE

OpenAI o1

国产AI

分享至

打开微信扫一扫

内容投诉

生成图片

大模型的中场战事：CoE or MoE ？

标题：大模型的中场战事：CoE或MoE？正文：大模型的淘汰赛比想象中更快到来。创投市场的资金流入虽有所增长，但交易数量下滑，显示产业格局正迅速向强者集中。大厂之间的价格战彻底关闭了后来者的市场通道，轻量级模型价格内卷激烈，后来者难以跟进。短短两年内，技术尚未触及极限，产业已从萌芽演变为江山初定...

原文链接