
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
微软Azure AI语音服务于8月23日推出全新功能——文本到语音虚拟人(Text to Speech Avatar)。这一创新技术让开发者能够利用Azure AI文本转语音技术,将简短文本转化为具有人类自然说话风格的视频,实现文本与视觉的无缝融合。此功能支持创建个性化虚拟人,输出视频分辨率为1920 x 1080,帧率为每秒25帧。用户可选择不同人物预设形象,并借助Azure AI生成的声音进行内容创作。此外,Speech Studio提供内容创建工具,支持实时聊天头像,实现互动体验。值得注意的是,服务定价基于视频时长,且已在全球多个地区包括东南亚、北欧、西欧、瑞典中部、美国中南部和美国西部正式上线。此功能不仅丰富了AI语音应用的展现形式,也为开发者提供了更多创意空间和商业机会。
原文链接
加载更多

暂无内容