综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
《科创板日报》10日讯,阿里AI视频大模型HappyHorse预计一周后对外发布。该模型已内部上架阿里百炼平台。4月8日,HappyHorse1.0以1333 Elo分登顶Artificial Analysis视频竞技场排行榜,对OVI 1.1胜率达80%,对LTX 2.3胜率为60.9%,成为全球排名最高的开源视频生成模型。(记者 黄心怡)
原文链接
2026年4月,神秘AI模型HappyHorse-1.0悄然登顶Artificial Analysis的AI Video Arena排行榜,力压Seedance 2.0和可灵等知名模型。其在文本转视频(无音频)赛道Elo分数达1375,领先第二名约100分;图像转视频赛道更以1409分刷新历史纪录,并在有音频赛道拿下全球第一。HappyHorse-1.0采用40层单流Transformer架构,支持音视频同步生成,仅需8步去噪即可输出1080P视频,推理速度大幅提升。据传,该模型由阿里淘天集团未来生活实验室研发,团队负责人张迪曾任职快手、哔哩哔哩,拥有丰富的大模型研发经验。目前模型尚未正式发布,预计将于4月10日揭晓,且可能完全开源。
原文链接
4月3日,阿里发布全新升级的Wan2.7-Video视频生成模型。该模型涵盖文生视频、图生视频、参考生视频和视频编辑四大功能,将AI能力从单一素材生成扩展至创作全链路,为用户提供更全面的视频生成与编辑支持。这一升级进一步提升了AI在多媒体创作领域的应用潜力,展现了技术的新鲜性与实用性。
原文链接
2026年3月,阿里云百炼平台正式上线全球领先的AI视频生成模型PixVerse V5.6,成为首批引入的三方视频生成模型。此次合作标志着PixVerse从技术领先迈向商业应用的关键一步,并提供文生视频、图文生视频等多种创作模式,支持按需按时长计费,降低高质量视频制作门槛。PixVerse V5.6在复杂运动场景中表现优异,具备精准的镜头语言理解能力,音画同步达到商业交付标准。依托阿里云的算力底座与全球化分发能力,PixVerse赋能电商营销、泛娱乐内容及短漫剧创作等行业,推动AI视频工业化生产。未来,PixVerse V6模型也将发布,进一步拓展视频生成边界。
原文链接
2月14日,字节跳动发布新一代视频生成模型Seedance 2.0,获央视财经点赞,称其“改变电影制作生态,让中国AI技术惊艳世界”。该模型采用多模态音视频联合生成架构,支持文字、图片、音频、视频混合输入,内置“导演脑”,可自主设计分镜,精准还原复杂脚本,保持主体一致性。其物理动态与光影效果逼近实拍,画面可用率达业界顶尖水平,支持多种风格一键生成高清商用视频。《黑神话:悟空》制作人冯骥评价其为“当前地表最强视频生成模型”,认为将颠覆游戏CG制作流程。国外反响热烈,马斯克称“发展太快”,美国导演感叹“好莱坞要被AI颠覆”。
原文链接
2月12日,豆包视频生成模型Seedance 2.0正式上线,接入豆包App、电脑端及网页版。新模型支持原声音画同步、多镜头长叙事及多模态可控生成,用户只需输入提示词和参考图,即可生成带完整原生音轨的多镜头视频。Seedance 2.0能自动解析叙事逻辑,确保生成的镜头序列在角色、光影、风格与氛围上高度统一,为用户提供更优质的创作体验。
原文链接
《科创板日报》1月31日讯,可灵AI推出新一代视频生成模型可灵3.0系列,目前处于内测阶段。该系列包括可灵视频3.0、可灵视频3.0 Omni和可灵图片3.0,覆盖图片生成、视频生成、视频编辑及后期处理等影视制作全流程。这一更新标志着AI技术在影视领域的进一步拓展,为内容创作者提供更高效、智能的工具支持。
原文链接
11月21日,腾讯混元大模型团队宣布开源最新视频生成模型HunyuanVideo 1.5。该模型基于Diffusion Transformer(DiT)架构,参数量为8.3B,是一款轻量级工具,可生成5-10秒高清视频。据悉,这一模型已在“腾讯元宝”平台上线,进一步提升了视频生成的效率与质量。此次开源将为开发者和研究者提供更强大的技术支持,推动视频生成领域的发展。(记者 李佳怡)
原文链接
美团最新开源的视频生成模型LongCat-Video,以13.6B参数量成为当前开源领域的SOTA(最佳性能)模型。这款模型支持文生视频、图生视频以及视频延长功能,能够生成长达数分钟的高质量视频,画质清晰且物理逻辑逼真。
官方演示中,无论是空中滑板、特效变身,还是第一视角骑行视频,LongCat-V...
原文链接
10月27日,美团LongCat团队发布并开源LongCat-Video视频生成模型。该模型在文生、图生视频任务上达到开源SOTA水平,支持分钟级长视频连贯生成,保障跨帧时序一致性与物理运动合理性。基于Diffusion Transformer架构,模型通过“条件帧数量”区分任务,原生支持文生、图生及视频续写三大核心功能,形成完整任务闭环。其文生视频可生成720p、30fps高清内容,精准解析文本细节;图生视频严格保留图像属性与风格;视频续写是其核心能力,支持多帧续接长视频内容。依托创新机制,模型可稳定输出5分钟级长视频,无质量损失。项目已开源,详见GitHub与Hugging Face链接。
原文链接
加载更多
暂无内容