音画同出 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

5天连更5次，可灵AI年末“狂飙式”升级

12月伊始，可灵AI在5天内完成5次重大更新，推出多项创新功能。其中包括全球首个统一多模态创作工具“可灵O1”，支持从图片到视频的高效生成与编辑；以及具备“音画同出”能力的可灵2.6模型，可直接生成含语音、音效和环境音的完整视频，极大提升创作效率。此外，数字人2.0功能上线，支持长达5分钟的自定义数字人视频生成。此次密集更新展现了可灵AI对生成式AI技术的极致追求，其技术已在影视、广告等超过2万家企业中应用。快手高级副总裁盖坤表示，可灵AI的目标是让每个人都能用AI讲述好故事，这一愿景正加速实现。

原文链接

未来笔触

12-10 14:49:52

可灵AI

多模态创作

音画同出

分享至

打开微信扫一扫

内容投诉

生成图片

快手可灵 2.6“音画同出”模型上线，单次生成可同时产出画面、语音、环境音

12月3日，快手旗下可灵AI推出首个“音画同出”模型，正式上线。该模型支持单次生成同时输出画面、自然语音、音效及环境氛围，打通音画创作边界。可灵2.6提供两种创作路径：文生音画（从文字生成完整音视频）和图生音画（让静态图开口说话并动起来）。其功能覆盖多种场景，包括单人独白（如商品展示、Vlog）、旁白解说（如赛事解说、纪录片）、多人对白（如短剧、访谈节目）以及音乐表演（如合唱、乐器演奏）。官方称其为“音画全盘掌控”，适用于多样化的内容创作需求。体验链接已开放，供用户探索使用。

原文链接

灵感Phoenix

12-03 23:48:00

AI模型

快手可灵

音画同出

分享至

打开微信扫一扫

内容投诉

生成图片

对标Sora 2还免费的国产AI，到底啥水平？

2025年10月11日，国产AI模型GAGA-1正式免邀请码全量上线，由Gaga AI团队推出。该模型专注于人物对话的影视级音画同出能力，定位为全球首个此类细分赛道工具。用户只需上传人物图片或生成图片，并输入效果描述，即可生成10秒720p视频，实际生成时间不到2分钟。测试显示，GAGA-1在情绪表达、口型同步及多角色互动方面表现出色，如《甄嬛传》经典台词重现、《无间道》诙谐恶搞等场景均展现了细腻表演质感。此外，支持多语种功能，能处理复杂情绪切换和对手戏演绎，但细节上仍有优化空间。专家认为，GAGA-1代表了AI视频从单纯画面生成向塑造人物表演的进化趋势，未来或成AI视频技术的重要突破点。

原文链接