综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
1月21日,阿里千问在Hugging Face开源社区刷新纪录,衍生模型突破20万个,下载量超10亿次,日均下载110万次,超越美国Llama居全球第一。衍生模型数量被视为开源影响力的核心指标,自2023年起,阿里已开源近400个大模型,推动开发者基于千问开发新技术与应用,如斯坦福李飞飞团队训练出新模型s1。目前,千问衍生模型日增超200个,覆盖机器人控制、代码生成等多领域。千问支持0.5B到480B参数规模及119种语言,适配多模态应用和小语种AI开发,成为实际应用落地的重要标杆。
原文链接
截至2025年11月,中国企业在生成式AI模型领域的全球市场份额已从一年前的1%飙升至15%,展现强劲崛起势头。数据显示,中国开源AI模型平均占全球份额13%,部分时段甚至达30%。约40%的中国模型被用于编程、设计等专业领域,显示高效实战能力。与美国闭源模式不同,中国企业如DeepSeek和阿里巴巴的Qwen(千问)以开源形式提供低成本解决方案,广受开发者青睐。在日经针对92个主要模型的日语评分中,DeepSeek位列第9,位居开源模型全球第一,性能超越谷歌和OpenAI的开源产品。此外,中国开源AI正成为日本企业及研究机构的重要基础,包括日本国产AI项目“LLM-jp”也采用Qwen整理学习数据。
原文链接
2026年1月16日,DeepSeek即将迎来出圈一周年。这家由幻方量化孵化的AI企业,凭借2025年初发布的DeepSeek-R1模型成为全球焦点,下载量超越ChatGPT。其低成本高成效策略推动开源大模型发展,V3.2版本已能对标GPT-5。尽管估值高达1.05万亿元,位居全球第四大独角兽,但DeepSeek面临激烈竞争:阿里巴巴、百度等互联网巨头纷纷加码开源模型,新兴玩家如九坤投资也瞄准其生态位。此外,场景之争中,DeepSeek月活用户较巅峰期下降约四分之一,落后于豆包等竞品。创始人梁文锋表示,DeepSeek将专注基础模型创新,错位竞争。外界对其2026年2月计划发布的V4模型充满期待,但AI竞赛更考验耐力与长远布局。
原文链接
2026年1月16日,韩国人工智能基础模型竞赛陷入‘技术独立性’争议。该赛事于去年6月启动,目标是到2027年前开发两款媲美国际领先水平的本土AI模型。然而,5家入围团队中3家被指使用外国开源组件,部分模型与中国开源模型高度相似。未入围企业Sionic AI指控Upstage的模型疑似微调自中国智谱AI模型,且保留其版权标记。此外,Naver和SK电讯的模型也被质疑与阿里巴巴、OpenAI及DeepSeek的产品存在相似性。尽管相关企业辩称符合开源协议,但技术审计显示涉事模型‘专属优化逻辑’重合度超80%,可能直接复用或修改中国代码。韩国科技部已启动专项审查,同时表态支持追赶全球AI技术进度。
原文链接
2026年1月12日,千寻智能的具身智能模型Spirit v1.5在RoboChallenge真机评测榜上以总分66.09、成功率50.33%的成绩超越美国Physical Intelligence的Pi0.5,登顶榜首,成为首个成功率超50%的国产模型。Spirit v1.5在插花、水果入篮、挂牙刷杯等任务中表现优异,尤其在“寻找绿盒”任务中成功率达90%,并以多样化预训练数据策略显著提升泛化能力。团队同步开源模型权重、推理代码及样例,推动研究社区复现与探索。千寻智能由韩峰涛和高阳于2024年创立,致力于通用人形机器人与具身大模型的研发,其技术已在宁德时代产线落地。此次登顶被视为具身智能领域的重要里程碑。
原文链接
2026年1月,国产具身智能基座模型WALL-OSS在RoboChallenge真机评测中以46.43分拿下全球第二,超越美国公司Physical Intelligence的pi0。该开源模型在叠洗碗巾、挂口杯等多项任务中取得单项第一。RoboChallenge是首个真实物理环境的大规模多任务基准测试,强调透明性和可复现性。WALL-OSS由自变量机器人开发,采用共享注意力+专家分流架构,解决了灾难性遗忘与模态解耦难题。团队已完成近10亿元A+轮融资,致力于构建通用具身智能基座。其开源特性大幅降低行业创新门槛,推动社区共同验证和改进技术,为具身智能领域树立了重要里程碑。
原文链接
2026年1月6日,英伟达在CES 2026上发布全球最大规模开源数据集及四大开源AI模型,涵盖语言、机器人、自动驾驶和医疗领域。数据集包含10万亿个语言tokens、50万条机器人轨迹、45.5万个蛋白质结构和100TB车辆传感器数据。新模型包括智能体AI的Nemotron系列(语音识别性能提升10倍)、物理AI的Cosmos平台(提升机器人环境感知能力)、自动驾驶的Alpamayo系列(首个开源大规模推理VLA模型)以及医疗领域的Clara模型(加速药物研发)。博世、Salesforce等科技巨头已采用这些技术构建下一代AI系统。
原文链接
正文:12月31日,阿里通义大模型开源发布Qwen-Image-2512,聚焦三大核心能力提升:更真实的人物质感、更细腻的自然纹理和更复杂的文字渲染。新模型可精准刻画皮肤、发丝及表情,理解语义细节,并细腻呈现水流、苔藓等自然纹理,还能生成多格漫画和技术图表等内容。在AI Arena超1万局用户盲测中,Qwen-Image-2512表现优于其他开源模型,与闭源模型对比亦具竞争力。该模型已全面开源。
原文链接
2025年AI行业正从“跑分”转向“信任”,开源模型成为默认选择。权威平台OpenRouter数据显示,开源模型的token份额年底突破三分之一,复杂任务调用量飙升至超50%。评测体系从单一分数转向多维评估,Kimi K2 Thinking等模型因性能与成本平衡获关注。部署方面,硬件优化使推理加速10倍、成本降低90%,云端平台实现透明化定价。交付强调治理、可观测与可复现,三大云厂商将顶级模型纳入企业托管服务。行业未来焦点将是可控性、安全性及生产稳定性,信任成为AI商业成功关键。
原文链接
12月21日,由英伟达、斯坦福大学和加州理工学院等联合研发的开源模型NitroGen发布。该模型基于GROOT N1.5架构,可玩转千余款游戏,涵盖角色扮演、平台跳跃、竞速等多种类型,无论是2D还是3D游戏均能驾驭。研究团队利用超过4万小时的游戏主播实机演示视频训练模型,使其具备快速动作控制能力与跨领域适应性,在未知游戏中的任务成功率较从零训练的模型提升52%。NitroGen不仅推动了具身智能体技术的发展,还有望反哺机器人技术。目前,模型权重、数据集及代码已全面开源,供开发者优化使用。
原文链接
加载更多
暂无内容