
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
8月11日,智谱AI发布全球100B级效果最佳的开源视觉推理模型GLM-4.5V(总参数106B,激活参数12B),并在魔搭社区与Hugging Face同步开源。该模型基于GLM-4.5-Air,综合性能在41个视觉多模态榜单中达同级别SOTA水平,涵盖图像、视频、文档理解等任务。新增“思考模式”开关,可灵活选择快速响应或深度推理,并支持全场景视觉推理,如复杂图表分析、长视频分镜处理等。同时,智谱AI开源一款桌面助手应用,可实时截屏、录屏并依托GLM-4.5V完成代码辅助、文档解读等任务,旨在赋能开发者打造多模态应用场景,将科幻变为现实。API调用价格低至输入2元/M tokens,输出6元/M tokens。
原文链接
百度计划于2025年8月底前发布一款新的AI推理模型,该模型可处理更复杂任务,以应对与DeepSeek和OpenAI等公司的竞争。此外,百度还将在未来几个月推出其核心基础模型的更新版本——文心5.0(Ernie 5.0)。今年3月,百度已发布了文心大模型4.5和X1,其中4.5在多模态理解和逻辑推理等方面表现优于GPT4.5,而X1则对标DeepSeek-R1,具备多模态与多工具调用能力。新模型的发布将进一步巩固百度在AI领域的竞争力。
原文链接
标题:揭秘:OpenAI如何发展推理模型?
正文:
ChatGPT的爆火看似偶然,但背后却是OpenAI多年深思熟虑的结果。科技媒体Techcrunch的深度文章揭示了OpenAI从数学竞赛到“通用AI智能体”的宏大愿景,其核心是对AI“推理”能力的终极探索。
意外的起点是数学。2022年,...
原文链接
2025年8月初,外媒曝光GPT-5开发内幕:核心团队被小扎挖角致内部混乱,推理模型技术瓶颈让项目一度停滞。Orion模型因性能不佳降级为GPT-4.5,且GPT-5未达GPT-3到GPT-4级别的跃迁。尽管如此,OpenAI获83亿美元融资,估值达3000亿美元,投资者信心仍存。新突破来自Q*技术与推理模型o3,但聊天场景适配问题仍未解决。OpenAI正开发“通用验证器”优化强化学习,CEO称GPT-5能力远超人类。下周发布在即,期待值拉满。
原文链接
7月31日,阿里通义千问发布全新推理模型Qwen3-30B-A3B-Thinking-2507,多项能力显著提升。新模型在数学能力评测AIME25中获85.0高分,代码能力测试LiveCodeBench v6得分66.0,超越Gemini2.5-Flash和Qwen3-235B-A22B。其知识水平、写作、Agent能力、多轮对话及多语言指令遵循等通用能力均表现优异。上下文长度原生支持256K tokens,可扩展至1M tokens,思考长度也增加,适合复杂推理任务。该模型已开源,可在魔搭社区、HuggingFace获取,并支持消费级硬件本地部署,同时上线Qwen Chat平台。
原文链接
2025年7月,阶跃星辰在WAIC发布新一代基础大模型Step 3,参数达321B,具备多模态推理能力,并计划于7月31日正式开源。该模型在MMMU等多模态榜单中取得开源模型新SOTA成绩,推理解码成本仅为DeepSeek的1/3,国产芯片适配效率最高可达其300%。Step 3通过系统协同设计优化解码效率,创新包括AFD分布式推理系统和MFA注意力机制,显著降低硬件成本与延迟。同时,阶跃联合华为昇腾等近10家厂商发起“模芯生态创新联盟”,推动软硬件协同发展。终端应用方面,Step 3已落地智能座舱、手机及IoT设备,预计2025年全年收入冲刺10亿人民币,成为AI产业务实性选项的代表。
原文链接
7月25日,阿里通义千问发布Qwen3-235B-A22B-Thinking-2507模型升级版。该模型在推理性能和通用能力上均有显著提升,号称比肩Gemini-2.5 pro、O4-mini等顶尖闭源模型,并创下开源模型SOTA最佳表现。其核心能力覆盖编程(LiveCodeBench)、数学(AIME25)、知识问答(SuperGPQA)、创意写作(WritingBench)、多语言支持(MultilF)等领域,同时支持256K长文本理解。新模型已通过魔搭社区和Hugging Face开源,采用Apache2.0协议,可免费下载商用。
原文链接
2025世界人工智能大会前夕,阶跃星辰于7月25日在上海发布新一代基础大模型Step 3,主打原生多模态与行业领先的推理效率,将于7月31日开源。该模型采用MoE架构,参数量达321B,在MMMU等榜单中取得开源多模态推理模型的最优成绩。阶跃星辰联合多家芯片厂商发起“模芯生态创新联盟”,推动全产业链协同创新,并与上海国投达成深度战略合作,加速大模型应用落地。目前,Step 3已适配华为昇腾等芯片,广泛应用于手机、汽车及金融等领域。
原文链接
7月25日,阿里巴巴在《科创板日报》宣布开源全新千问3推理模型,性能显著提升,成为全球最强开源模型,媲美顶级闭源模型Gemini-2.5 pro和o4-mini。本周,阿里已连续开源三款重磅模型,分别在基础模型、编程模型和推理模型三大主流领域夺得全球开源冠军,进一步巩固其在人工智能领域的领先地位。
原文链接
7月20日,英伟达推出全新推理模型套件OpenReasoning-Nemotron,包含基于Qwen-2.5微调的1.5B、7B、14B和32B四款模型,源自6710亿参数的DeepSeek R1 0528大模型。通过“蒸馏”技术,大幅降低部署门槛,普通游戏电脑即可运行高级推理任务,节省GPU与云计算成本。该套件依托NeMo Skills生成的500万条数据集,采用监督学习微调,无需强化学习。测试显示,32B模型在AIME24数学竞赛中获89.2分,HMMT 2月赛达73.8分,最小的1.5B模型也有不俗表现。模型支持“GenSelect模式”,可生成多种解答版本以优化准确率,在多项基准测试中媲美甚至超越OpenAI o3-high。完整检查点已在Hugging Face开放下载,助力科研探索与定制优化。
原文链接
加载更多

暂无内容