
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
11月25日,英伟达发布音乐生成AI模型Fugatto,称其为“全球最灵活的声音机器”。该工具被誉为声音领域的“瑞士军刀”,能够精细化控制声音生成,不仅限于创作音乐,还能修改和混合各种声音。用户通过简单的文字描述或音频输入,即可生成音乐片段、音效及调整人声特质。例如,“会喵喵叫的小号”或“包含萨克斯管嚎叫、狗吠声和电子音乐的曲子”等创意提示都能实现。此外,Fugatto可生成独特声音效果,如“深沉的低音脉冲与高音数字鸣叫声交织”的巨型智能机器苏醒声,甚至可以改变音频片段的口吻和语气,如将柔声细语变成愤怒咆哮。此工具对音乐艺术家而言尤其有用,支持分离歌曲中的主唱、添加乐器,甚至将钢琴声替换为歌剧演唱,以随意改编音乐旋律。详细操作可见相关视频演示。
原文链接
**摘要:**
英伟达近日推出全新AI模型Fugatto,该模型能够生成音乐、修改人声,并根据自然语言提示创作声音效果。Fugatto是首个具备混合训练元素及遵循“自由形式指令”的基础模型,可实现多种音频转换功能。用户不仅能将语音翻译成另一种语言,同时保持原有音色,还能将简单旋律转化为复杂的管弦乐表演,甚至添加不同节奏。此外,该模型可将文本转化为指定声音的朗读,甚至带有情感色彩的声音。尽管Fugatto不完美,但它可能对音乐、娱乐及翻译服务等多个行业产生深远影响。英伟达表示,目前没有发布此技术的具体计划,但希望它能成为艺术家探索的新工具。据英伟达应用深度学习研究副总裁Bryan Catanzaro透露,Fugatto的多功能性为音频创作提供了新前景。
(发布日期:2023年11月26日)
原文链接
加载更多

暂无内容