正文:2025年12月17日,Meta发布多模态音频分离模型SAM Audio,可从复杂音频中提取特定声音。该模型支持文本、视觉和时间片段提示,用户可通过输入关键词、点击视频目标或标记时间段实现精准音频分离,例如提取乐队演出中的吉他声或过滤嘈杂环境音。其核心引擎Perception Encoder Audiovisual(PE-AV)基于开源技术构建,扩展了计算机视觉在音频领域的应用。同时,Meta推出首个真实场景音频分离基准测试SAM Audio-Bench及自动评估模型SAM Audio Judge,进一步推动音频处理技术发展。
原文链接
本文链接:https://kx.umi6.com/article/30379.html
转载请注明文章出处
相关推荐
换一换
又一高管弃库克而去!苹果UI设计负责人转投Meta
2025-12-04 16:28:47
近300亿美元!Meta即将落实创纪录私人融资交易支持数据中心建设
2025-10-17 16:29:28
OpenAI宋飏被Meta挖跑了!扩散模型崛起关键人物,加入MSL再会师清华校友赵晟佳
2025-09-25 22:11:00
Meta和Scale AI闹翻!砸143亿买的高管跑路,业务也合作不下去
2025-09-01 15:17:44
LeCun今后发论文得亚历山大王批准!Meta搞出大无语操作
2025-09-02 18:35:21
扎克伯格,也顶不住了
2025-08-22 21:53:17
Meta使用阿里千问优化其最新AI模型
2025-12-11 00:19:01
拒绝小扎15亿美元offer的大佬,还是加入Meta了
2025-10-12 10:40:02
从视频一键提取某个声音:Meta 发布 SAM Audio,多模态音频分离新突破
2025-12-18 00:10:29
硅谷巨头强强联手!谷歌与Meta达成100亿美元云计算合同
2025-08-22 10:52:34
AI领域大新闻!不光是重组团队 Meta被曝已暂停AI招聘
2025-08-21 11:34:26
Meta可能在明年初推出新AI大模型Avocado
2025-12-09 22:02:45
涉嫌使用盗版成人影片训练AI大模型:Meta遭起诉索赔3.59亿美元
2025-08-22 15:51:07
594 文章
374660 浏览
24小时热文
更多
-
2025-12-18 01:11:33 -
2025-12-18 00:10:29 -
2025-12-18 00:09:16