2月6日,字节跳动展示了OmniHuman多模态框架,可通过一张图片和一段音频生成逼真的全身动画。该技术能精准同步手势、面部表情与语音或音乐。OmniHuman-1模型基于约19000小时的人类运动数据训练,支持不同体型和画面比例,生成的视频效果更自然。研究人员称,OmniHuman-1在真实性和准确性方面超越了其他同类工具。目前,该工具暂不提供下载或服务。
原文链接
本文链接:https://kx.umi6.com/article/12710.html
转载请注明文章出处
相关推荐
换一换
OpenAI推出首款搭载英伟达竞争对手Cerebras芯片的AI模型
2026-02-13 02:57:22
谷歌前 CEO 施密特示警:AI 模型极容易被黑客利用
2025-10-11 09:58:07
谷歌最强 AI 模型 Gemini 3 正式登场:发布即登顶 LMArena,号称迄今最智能
2025-11-19 08:02:25
Anthropic 性价比最高 AI 模型:Haiku 4.5 登场,1/3 价格实现 Sonnet 4 同级编程能力
2025-10-16 07:47:06
谷歌发布 Gemini 2.5 Computer Use 模型:专攻浏览器交互,支持 13 种操作
2025-10-09 09:08:03
字节Seed发布GR-RL 首次实现真机强化学习穿鞋带
2025-12-02 14:21:13
投资界24h |字节跳动,新王炸诞生了;海光信息、中科曙光终止重大资产重组;嘉御资本募资,超40亿
2025-12-10 09:33:07
OpenAI将全面杀入企业级市场
2026-01-04 16:14:13
宇树王兴兴:机器人性能已达标 AI模型称成最大瓶颈
2025-09-11 19:02:35
放开成人内容,OpenAI是为了提升性能?
2025-10-22 17:49:49
奥尔特曼即将推出新模型“Shallotpeat”,承认谷歌威胁到 OpenAI
2025-11-24 17:06:52
豆包相关负责人否认“豆包 AI 眼镜”即将出货
2026-01-05 20:24:10
马斯克xAI新模型上线,通过“50米外洗车店”测试,回答偏好高度贴合老马本人
2026-02-18 16:31:22
693 文章
593360 浏览
24小时热文
更多
-
2026-04-24 18:28:12 -
2026-04-24 18:27:05 -
2026-04-24 18:26:00