1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
阶跃星辰发布端到端语音大模型 Step-Audio 2 mini,多个基准测试取得 SOTA 成绩
2025年9月1日,阶跃星辰发布开源端到端语音大模型Step-Audio 2 mini,并在多个国际基准测试中取得SOTA成绩。该模型统一语音理解、音频推理与生成,支持语音原生Tool Calling能力,可实现联网搜索等操作。其综合性能超越Qwen-Omni、Kimi-Audio等开源模型及GPT-4o Audio,在音频理解、语音识别、翻译和对话场景中表现突出。例如,在中英互译任务上,其CoVoST 2和CVSS评分分别达39.3和29.1;语音识别任务中,中文CER为3.19,英语WER为3.50,领先其他开源模型15%以上。通过真端到端多模态架构、CoT推理结合强化学习及音频知识增强,Step-Audio 2 mini有效解决传统语音模型智商情商不足的问题,现已上线阶跃星辰开放平台并开源。
代码编织者Nexus
09-01 15:21:09
SOTA
Step-Audio 2 mini
端到端语音模型
分享至
打开微信扫一扫
内容投诉
生成图片
Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新
2025年8月6日,Anthropic正式发布Claude Opus 4.1,该版本在编程性能上再次突破,超越前代及竞品,拿下SOTA成绩。新模型在Agent任务和推理能力方面也显著提升,定价保持不变。实测显示其开发小游戏等任务表现稳定。官方透露未来几周将推出更大规模升级。客户反馈积极,GitHub和Rakuten Group均认可其改进,特别是在代码修复和跨文件重构上的表现。Anthropic还通过客户背书暗秀合作关系,与OpenAI形成鲜明对比。此外,Opus 4.1的System Card同步发布,明确其核心调整未改变模型尺寸或训练方法。无害回复率提升至99.06%。目前,Opus 4.1已向所有付费用户开放,并支持多种平台使用。
梦境编程师
08-06 11:26:58
Claude Opus 4.1
SOTA
编程性能
分享至
打开微信扫一扫
内容投诉
生成图片
智谱发布首款SOTA级原生智能体大模型
7月28日,智谱发布旗舰模型GLM-4.5并开源,这是首款SOTA级原生智能体大模型,综合评测位居国产第一,性能媲美全球顶级模型。新模型参数效率翻倍,API价格仅为Claude的1/10,推理速度超100tokens/秒。其创新性地将推理、代码、Agent等多能力原生融合,目前已上线智谱清言和z.ai平台,开放免费体验。
智慧棱镜
07-28 21:20:48
GLM-4.5
SOTA级
智谱
分享至
打开微信扫一扫
内容投诉
生成图片
开源Qwen一周连刷三冠,暴击闭源模型!基础模型推理编程均SOTA
2025年7月,阿里通义千问开源Qwen3系列完成三连发,接连推出Qwen3-Coder、Qwen3-235B-A22B-Instruct-2507和Qwen3-235B-A22B-Thinking-2507模型,分别在编程、基础模型和推理领域刷新全球开源SOTA记录。其中,最新推理模型在逻辑推理、数学及编程任务中表现突出,超越闭源模型如Gemini-2.5 Pro和o4-mini。实测显示其在复杂问题解决上具备显著优势。此轮开源引发国际热议,HuggingFace等业内专家盛赞‘这是开源的胜利’。阿里已开源超300款模型,衍生模型突破14万个,成为全球第一开源家族,并计划三年内投入3800亿元升级AI基础设施。中国开源力量正引领全球前沿发展。
蝶舞CyberSwirl
07-26 13:39:05
SOTA
中国开源
开源Qwen
分享至
打开微信扫一扫
内容投诉
生成图片
荣耀 MagicGUI 大模型发布并开源,效果比肩 SOTA 模型
2025年7月26日,荣耀正式发布并开源MagicGUI大模型,支撑YOYO智能体实现多模态感知与自动化执行。作为“阿尔法战略”重要里程碑,该模型效果比肩SOTA模型,并由荣耀Magic V5首发搭载。今年3月,荣耀在MWC大会上提出“阿尔法战略”,宣布从智能手机制造商向全球AI终端生态公司转型。未来5年,荣耀将投入100亿美元(约合716.49亿元人民币),分三个阶段构建智慧手机、智慧生态系统及智慧世界,推动AI设备生态发展,与全球伙伴共创AI新时代。
AI创意引擎
07-26 10:35:47
SOTA 模型
荣耀 MagicGUI
阿尔法战略
分享至
打开微信扫一扫
内容投诉
生成图片
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
2025年7月12日,Kimi发布全新基础大模型Kimi K2,采用MoE架构,总参数1T,激活参数32B,支持128K上下文。新模型在代码、Agent任务和数学推理等领域表现卓越,创造多项开源SOTA成绩,并同步上线Web端、App及API服务。此次发布即开源,提供两个版本:Kimi-K2-Base与Kimi-K2-Instruct,遵循修改版MIT协议。这是自DeepSeek R1冲击172天后,Kimi的明确回应,表明其坚持自研大模型的决心。Kimi CEO杨植麟以实际行动证明技术领先性,重新回归竞逐AGI初心。
AGI探路者
07-12 13:50:53
Kimi K2
SOTA
开源模型
分享至
打开微信扫一扫
内容投诉
生成图片
蚂蚁开源轻量级推理模型Ring-lite,多项Benchmark达到SOTA
蚂蚁开源轻量级推理模型Ring-lite,在多项Benchmark中达到SOTA效果,性能媲美3倍激活参数大小的10B以下Dense模型,验证了MoE架构的潜力。Ring-lite基于此前开源的Ling-lite-1.5(总参数16.8B,激活参数2.75B)开发,并采用独创的C3PO强化学习训练方...
梦境编程师
06-23 21:30:02
Ring-lite
SOTA效果
蚂蚁开源
分享至
打开微信扫一扫
内容投诉
生成图片
Kimi新模型拿下代码开源SOTA,仅仅72B,发布即开源
Kimi新模型Kimi-Dev开源,参数量仅72B却拿下代码开源SOTA。该模型由月之暗面发布,在SWE-bench Verified上的成绩达到60.4%,超越最新DeepSeek-R1及部分闭源模型。 Kimi-Dev基于MIT协议开源,包含权重和代码,甚至有量化版本上线。其核心技术在于结合Bu...
LunarCoder
06-17 13:22:19
Kimi-Dev
代码模型
开源SOTA
分享至
打开微信扫一扫
内容投诉
生成图片
分割/识别/解说一个模型搞定!3B参数刷新视觉理解SOTA,图像视频全适配
分割、识别、解说一个模型搞定!3B参数刷新视觉理解SOTA,图像视频全适配 可以输出语义的「分割一切模型2.0」来了!一次交互即可实现「分割+识别+解释+描述」,同时支持图像、视频和长视频,文本&Mask同步输出! 由港中文MMLab、港理工、北京大学等机构开源的PAM(Perceive...
跨界思维
06-14 20:40:35
SOTA
分割一切模型
视觉理解
分享至
打开微信扫一扫
内容投诉
生成图片
1/15成本,实现AI水印新SOTA | 南洋理工大学&A*STAR
标题:1/15成本实现AI水印新突破 南洋理工大学与新加坡A*STAR前沿人工智能研究中心合作推出全新局部鲁棒图像水印方法MaskMark,其性能全面超越Meta的SOTA模型WAM,且训练成本仅为后者1/15。 MaskMark支持多水印嵌入、精准定位篡改区域、灵活提取局部水印及自适应支持32/6...
DreamCoder
05-31 13:06:45
AI水印
MaskMark
SOTA
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序