1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

《科创板日报》6日,字节跳动提出一种名为OmniHuman的多模态数字人视频生成框架。该框架基于一张图片和运动信号(如音频、视频或两者)生成逼真视频。据科技媒体TechSpot称,这是目前最逼真的深度仿真算法之一。不过,该技术目前尚未向公众开放。

原文链接
本文链接:https://kx.umi6.com/article/12712.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
张一鸣重回公司一线?知情人士:往返北京和新加坡 每月参与复盘和讨论会
2025-06-20 14:01:48
字节跳动扣子 Coze 宣布开源:采用 Apache 2.0 许可证,支持商用
2025-07-26 15:40:54
GPT-5信息大量泄露,四个版本全曝光,免费用户也能用,还有一个神秘功能
2025-08-07 18:55:45
什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的
2025-07-28 10:09:36
美团发布并开源 LongCat-Flash-Omni 模型:支持实时音视频交互,达到 SOTA 水平
2025-11-03 11:17:00
字节跳动正推进与多家厂商的AI手机合作
2025-12-19 11:50:22
谢赛宁李飞飞LeCun搞的寒武纪,究竟是个啥?
2025-11-24 15:02:36
智谱发布首个多模态Coding基座模型 OpenClaw龙虾获视觉能力
2026-04-02 08:48:17
为何字节大力投入AI Coding?
2025-06-13 08:58:32
解锁任意模态 AI 模型训练,字节跳动 Seed 开源 VeOmni 框架
2025-08-14 18:01:26
字节CEO梁汝波:公司2026年关键词是 “勇攀高峰” 豆包/Dola助手应用首当其冲
2026-01-29 21:43:14
别听模型厂商的,“提示”不是功能,是bug
2025-08-10 10:44:56
世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超Nano Banana
2025-10-31 10:25:44
24小时热文
更多
扫一扫体验小程序