7月5日,AI聊天机器人平台Character.AI发布研究论文与视频演示,展示了一项名为TalkingMachines的自回归扩散模型。该技术通过输入图片和声音信号,可实现实时、逼真的音频视觉互动,类似FaceTime通话效果。模型基于Diffusion Transformer(DiT)技术,结合流匹配扩散、音频驱动交叉注意力等多项创新技术,能生成自然的面部表情、手势及精准口型同步。此外,TalkingMachines支持多种风格角色,包括真实感人类、动漫及3D虚拟形象。尽管尚未部署于平台,这项突破被视为迈向实时互动AI角色的重要一步。
原文链接
本文链接:https://kx.umi6.com/article/21246.html
转载请注明文章出处
相关推荐
.png)
换一换
米哈游蔡浩宇AI游戏曝光:大模型驱动数字人实时互动,玩家自定义开放剧情,内测已开启!
2025-03-15 22:15:11
大模型公司并购潮渐起,谷歌25亿美元买下Character.AI
2024-08-05 20:56:45
被科技巨头围剿的AI男友,快聊不动了
2024-07-11 19:29:24
443 文章
76999 浏览
24小时热文
更多

-
2025-07-19 16:54:40
-
2025-07-19 15:54:36
-
2025-07-19 15:54:26