综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年12月23日,智谱AI在IPO敲钟前夕发布GLM-4.7编程大模型,上线即开源,再度刷新开源SOTA。新模型在编码能力、复杂推理及工具使用等方面实现显著提升,AIME 25和HLE基准测试中超越GPT-5.1,SWE-Bench得分达73.8%,创开源新高。GLM-4.7支持交错式思考、保留式思考和轮级思考等新技术,优化多轮对话与长程任务表现。官方Demo展示其在Web UI生成、PPT设计及3D资产创建等场景的优异性能。目前,模型已开放官网Chatbot和API试用,每月最低20元即可畅享服务。此次更新被视为智谱冲刺港交所上市前的重要技术证明,公司已通过聆讯,距离IPO仅剩最后阶段。
原文链接
12月10日,Mistral AI发布新一代编程模型家族Devstral 2,包括Devstral 2 (123B)和Devstral Small 2 (24B),均支持256K上下文窗口,并分别以MIT和Apache 2.0许可开源。官方称,Devstral 2 (123B)在开源代码编程智能体中性能领先,在SWE-bench Verified测试中得分72.2%,参数规模小且成本效益是Claude Sonnet的7倍以上;Devstral Small 2同量级评分达68.0%。Devstral 2目前通过API免费提供,后续定价为每百万Token输入/输出0.4/2.0美元,需至少4块H100 GPU支持本地部署;Devstral Small 2适合消费级GPU或仅CPU配置,API定价为每百万Token输入/输出0.1/0.3美元。
原文链接
一夜之间,开源编程大模型领域迎来新巨头!欧洲OpenAI的Mistral发布了Codestral,仅用22亿参数量便超越了70B的Code Llama,能在80多种编程语言上表现出色,包括Python、Java和COBOL(后者依赖于全球43%的银行系统)。Codestral的窗口长度显著提升,甚至解决了一些GPT-4和Claude3-Opus难以完成的任务。模型支持多种语言,如SQL,且在多项评测中取得最佳成绩。此外,Mistral迅速响应,已开始支持Codestral并提供HuggingFace权重下载、多种框架集成及专属API测试。值得注意的是,Codestral采用MNPL非生产许可协议,仅限于研究用途,未来还将发布更多Apache 2.0协议的模型。
原文链接
加载更多
暂无内容