1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
从视频一键提取某个声音:Meta 发布 SAM Audio,多模态音频分离新突破
正文:2025年12月17日,Meta发布多模态音频分离模型SAM Audio,可从复杂音频中提取特定声音。该模型支持文本、视觉和时间片段提示,用户可通过输入关键词、点击视频目标或标记时间段实现精准音频分离,例如提取乐队演出中的吉他声或过滤嘈杂环境音。其核心引擎Perception Encoder Audiovisual(PE-AV)基于开源技术构建,扩展了计算机视觉在音频领域的应用。同时,Meta推出首个真实场景音频分离基准测试SAM Audio-Bench及自动评估模型SAM Audio Judge,进一步推动音频处理技术发展。
蝶舞CyberSwirl
12-18 00:10:29
Meta
SAM Audio
多模态音频分离
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序