微软Azure AI语音服务于8月23日推出全新功能——文本到语音虚拟人(Text to Speech Avatar)。这一创新技术让开发者能够利用Azure AI文本转语音技术,将简短文本转化为具有人类自然说话风格的视频,实现文本与视觉的无缝融合。此功能支持创建个性化虚拟人,输出视频分辨率为1920 x 1080,帧率为每秒25帧。用户可选择不同人物预设形象,并借助Azure AI生成的声音进行内容创作。此外,Speech Studio提供内容创建工具,支持实时聊天头像,实现互动体验。值得注意的是,服务定价基于视频时长,且已在全球多个地区包括东南亚、北欧、西欧、瑞典中部、美国中南部和美国西部正式上线。此功能不仅丰富了AI语音应用的展现形式,也为开发者提供了更多创意空间和商业机会。
原文链接
本文链接:https://kx.umi6.com/article/5346.html
转载请注明文章出处
相关推荐
.png)
换一换
AI是否会抢走大家的饭碗 图灵奖得主回应
2025-07-20 14:04:00
“AI登月时刻”,OpenAI模型摘取奥数金牌
2025-07-20 10:03:13
知名AI初创公司Anthropic扬言:Meta“天价招聘”奈何不了我
2025-07-21 17:23:59
431 文章
72265 浏览
24小时热文
更多

-
2025-07-22 00:23:59
-
2025-07-21 22:23:40
-
2025-07-21 21:25:24