
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
7月5日,AI聊天机器人平台Character.AI发布研究论文与视频演示,展示了一项名为TalkingMachines的自回归扩散模型。该技术通过输入图片和声音信号,可实现实时、逼真的音频视觉互动,类似FaceTime通话效果。模型基于Diffusion Transformer(DiT)技术,结合流匹配扩散、音频驱动交叉注意力等多项创新技术,能生成自然的面部表情、手势及精准口型同步。此外,TalkingMachines支持多种风格角色,包括真实感人类、动漫及3D虚拟形象。尽管尚未部署于平台,这项突破被视为迈向实时互动AI角色的重要一步。
原文链接
加载更多

暂无内容