文本转语音虚拟人

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

微软 Azure AI 语音服务推出虚拟人形象，支持文本转视频

微软Azure AI语音服务于8月23日推出全新功能——文本到语音虚拟人（Text to Speech Avatar）。这一创新技术让开发者能够利用Azure AI文本转语音技术，将简短文本转化为具有人类自然说话风格的视频，实现文本与视觉的无缝融合。此功能支持创建个性化虚拟人，输出视频分辨率为1920 x 1080，帧率为每秒25帧。用户可选择不同人物预设形象，并借助Azure AI生成的声音进行内容创作。此外，Speech Studio提供内容创建工具，支持实时聊天头像，实现互动体验。值得注意的是，服务定价基于视频时长，且已在全球多个地区包括东南亚、北欧、西欧、瑞典中部、美国中南部和美国西部正式上线。此功能不仅丰富了AI语音应用的展现形式，也为开发者提供了更多创意空间和商业机会。

原文链接