正文:2025年12月17日,Meta发布多模态音频分离模型SAM Audio,可从复杂音频中提取特定声音。该模型支持文本、视觉和时间片段提示,用户可通过输入关键词、点击视频目标或标记时间段实现精准音频分离,例如提取乐队演出中的吉他声或过滤嘈杂环境音。其核心引擎Perception Encoder Audiovisual(PE-AV)基于开源技术构建,扩展了计算机视觉在音频领域的应用。同时,Meta推出首个真实场景音频分离基准测试SAM Audio-Bench及自动评估模型SAM Audio Judge,进一步推动音频处理技术发展。
原文链接
本文链接:https://kx.umi6.com/article/30379.html
转载请注明文章出处
相关推荐
换一换
Meta签下NVIDIA 跨世代订单:将部署数百万颗Blackwell与Rubin GPU
2026-02-18 11:20:21
Meta一边挥刀赶走老白兔,一边改绩效发甜枣
2026-01-16 15:46:56
消息称 Meta 正就为自有数据中心导入 TPU AI 芯片与谷歌洽谈
2025-11-25 11:48:26
LeCun离职,Meta市值应声蒸发1400亿
2025-11-12 08:53:31
Meta 万亿豪赌「AI 未来」
2026-01-30 13:42:29
Meta 大逃杀!扎克伯格「地狱模式」曝光,不拼命搞 AI 就滚蛋
2025-12-28 13:26:10
MWC现场直面Meta竞争,千问AI眼镜硬件性能碾压
2026-03-03 11:55:56
Meta Facebook 新增 AI 拼贴照片编辑功能引隐私争议,用户利用平台工具修图即被视为训练素材
2025-10-18 07:29:23
近300亿美元!Meta即将落实创纪录私人融资交易支持数据中心建设
2025-10-17 16:29:28
“AI争霸”格局大变:Alphabet被热捧Meta却坐冷板凳,为何?
2025-10-31 16:40:59
苹果搁置头显升级计划,优先开发可媲美Meta的智能眼镜
2025-10-02 06:02:35
Meta挖走苹果顶级设计师 加速AI硬件布局
2025-12-04 20:45:13
AI眼镜热度不减 Meta最新产品卖断货 CTO称销售点数量将翻番
2025-10-05 12:18:57
664 文章
477592 浏览
24小时热文
更多
-
2026-03-10 10:03:26 -
2026-03-10 10:02:35 -
2026-03-10 09:02:22