综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
12月伊始,可灵AI在5天内完成5次重大更新,推出多项创新功能。其中包括全球首个统一多模态创作工具“可灵O1”,支持从图片到视频的高效生成与编辑;以及具备“音画同出”能力的可灵2.6模型,可直接生成含语音、音效和环境音的完整视频,极大提升创作效率。此外,数字人2.0功能上线,支持长达5分钟的自定义数字人视频生成。此次密集更新展现了可灵AI对生成式AI技术的极致追求,其技术已在影视、广告等超过2万家企业中应用。快手高级副总裁盖坤表示,可灵AI的目标是让每个人都能用AI讲述好故事,这一愿景正加速实现。
原文链接
12月3日,快手旗下可灵AI推出首个“音画同出”模型,正式上线。该模型支持单次生成同时输出画面、自然语音、音效及环境氛围,打通音画创作边界。可灵2.6提供两种创作路径:文生音画(从文字生成完整音视频)和图生音画(让静态图开口说话并动起来)。其功能覆盖多种场景,包括单人独白(如商品展示、Vlog)、旁白解说(如赛事解说、纪录片)、多人对白(如短剧、访谈节目)以及音乐表演(如合唱、乐器演奏)。官方称其为“音画全盘掌控”,适用于多样化的内容创作需求。体验链接已开放,供用户探索使用。
原文链接
2025年10月11日,国产AI模型GAGA-1正式免邀请码全量上线,由Gaga AI团队推出。该模型专注于人物对话的影视级音画同出能力,定位为全球首个此类细分赛道工具。用户只需上传人物图片或生成图片,并输入效果描述,即可生成10秒720p视频,实际生成时间不到2分钟。测试显示,GAGA-1在情绪表达、口型同步及多角色互动方面表现出色,如《甄嬛传》经典台词重现、《无间道》诙谐恶搞等场景均展现了细腻表演质感。此外,支持多语种功能,能处理复杂情绪切换和对手戏演绎,但细节上仍有优化空间。专家认为,GAGA-1代表了AI视频从单纯画面生成向塑造人物表演的进化趋势,未来或成AI视频技术的重要突破点。
原文链接
加载更多
暂无内容