
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
阿里集团CEO吴泳铭在2025财年第三季度财报会上透露,阿里将于近期发布基于千问Qwen2.5-MAX的深度推理模型。1月29日,阿里云公布了全新通义千问Qwen 2.5-Max超大规模MoE模型,并在Chatbot Arena大模型盲测中以1332分位列全球第七,成为非推理类中国大模型冠军。Qwen2.5-Max在数学和编程等单项能力上排名第一,在硬提示方面排名第二,超越了DeepSeek V3、Open AI o1-mini和Claude-3.5-Sonnet等模型。
原文链接
中信建投研报指出,尽管DeepSeek R1的训练和推理算力需求较低,得益于算法、框架和硬件的优化协同。但在深度推理阶段,模型的未来算力需求仍将显著增长。充足的算力对AI模型性能提升至关重要。该信息于2月5日发布。
原文链接
百川智能于1月24日发布全场景深度思考模型Baichuan-M1-preview,具备语言、视觉和搜索三大领域推理能力。该模型在数学、代码等多项权威评测中表现优异,可对标o1-preview。此外,百川智能还推出了行业首个开源医疗增强大模型Baichuan-M1-14B,医疗能力超越更大参数量的Qwen2.5-72B,与o1-mini相当。Baichuan-M1-14B支持医疗循证模式,能快速精准回答医疗临床及科研问题。相关资源已在GitHub和Huggingface上开源。
原文链接
1月15日,科大讯飞发布星火深度推理模型X1,该模型是国内首个基于全国产算力平台训练的深度推理模型。X1在多项指标上达到国内第一,尤其在中文数学能力方面表现突出。此外,X1已在教育、医疗等领域实际应用。科大讯飞还计划在今年上半年发布基于X1的医疗大模型升级版。
原文链接
1月15日,科大讯飞发布星火深度推理模型X1,这是首个完全基于国产算力训练的深度推理模型。X1在解题方式上更接近人类的“慢思考”,并以较少的算力实现顶尖效果,多项指标国内领先。X1已在AI学习机、数学教学助手及医疗领域应用,如数学教学助手支持一题多解和拓展学生思维。此外,X1在多个测试集中表现优异,甚至与国外的OpenAI o1相比也不逊色。
原文链接
字节跳动近期因一名实习生恶意破坏模型训练,暴露出其在大模型训练方面的管理漏洞。与此同时,字节在视频方向上加大投入,推出PixelDance1和Seaweed2两款视频模型,但视频生成领域面临市场冷遇和高昂成本的挑战。百度CEO李彦宏表示不涉足Sora类视频生成,认为其商业化前景不明。当前视频模型普遍存在成本高、质量不佳及“AI味”过重等问题。相比之下,文本模型中的深度推理成为新的突破口,OpenAI推出的o1模型引发关注,国内大厂如字节、智谱清言和月之暗面纷纷跟进。然而,部分企业在追求“大而全”的同时,缺乏核心竞争力,难以在市场中占据优势。深度推理技术有望成为推动AI发展的关键,但目前仍需进一步探索和实践。
原文链接
北京时间10月8日,据“大厂青年”公众号爆料,北京月之暗面科技有限公司在国庆期间组织团队加班7天,以3倍工资激励员工。此举是为了赶制即将上线的“深入推理”功能,该功能将作为Kimi AI助手的新增特性,旨在通过深度思考解答复杂问题,甚至进行自我反思。Kimi AI助手于2023年10月首次亮相,支持输入20万汉字,由参与过多个大模型研发的核心团队打造。月之暗面成立于2023年3月,近期吸引了阿里巴巴和腾讯的关注,分别投资了约8亿美元和3亿美元,估值高达30亿美元。这一系列动作表明,AI领域的竞争正在加剧,各企业都在寻求创新突破以提升市场竞争力。
原文链接
加载更多

暂无内容