综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年2月5日,生数科技宣布完成超6亿元人民币A+轮融资,由中关村科学城公司和星连资本领投,万兴科技、视觉中国等战略投资。公司成立于2023年3月,专注于多模态通用大模型研发,其核心产品Vidu于2024年7月上线,首创“参考生视频”技术,解决商业视频生成难题,并在速度上领先OpenAI Sora等竞品10倍以上。2025年12月,生数科技开源TurboDiffusion框架,将视频生成效率提升100-200倍。目前,Vidu已成全球内容创作者及企业首选工具,用户和收入实现10倍增长。CEO骆怡航表示,公司将推动多模态大模型成为新一代生产力,重构内容生产与交互体验。创始人朱军强调,未来将持续探索AI在物理世界的应用价值。
原文链接
2026年2月1日,生数科技正式发布Vidu Q3,这是全球首个支持16秒音视频直出的AI视频模型。Vidu Q3以“为剧而生”为核心理念,突破了AI视频的时间长度、音画同步和生成可用性三大关键能力,首次实现情绪闭环叙事和端到端声画生成。在国际权威AI基准测试中,该模型排名中国第一、全球第二,超越Runway Gen-4.5、Google Veo 3.1等知名产品。其多镜头切换、多语言对话渲染等功能显著提升创作效率,重塑短剧、广告等内容产业生产模式。Vidu Q3的推出标志着AI视频正式进入工业化生产时代,成为内容生产的全链条工具。
原文链接
正文:2026年1月,中国AI视频生成领域迎来新突破,生数科技发布全球首个支持一次性生成16秒音视频的模型Vidu Q3。该模型不仅能制作高质量真人版《火影忍者》等影视级短片,还具备多语言支持(中文、英文、日文)及4K清晰度提升功能。其全自动特性包括音视频同步输出、运镜转场自由切换、文字与图片生成音视频等。Vidu Q3在国际权威AI基准测试机构Artificial Analysis榜单中排名中国第一、全球第二,超越Runway Gen-4.5、Google Veo3.1等知名模型。实测显示,Vidu Q3可精准理解场景需求,生成连贯剧情并自动补充细节(如弹幕、音效)。此外,其文生音视频功能支持多种宽高比和风格渲染,适用于不同类型的影视创作。这一技术标志着AI视频生成从单一视觉进化到多模态融合的关键节点,为行业带来全新可能性。
原文链接
1月14日,生数科技宣布Vidu AI开放平台上线“一键生成MV”功能。用户只需提供音乐、参考图像和文本指令,系统即可自动生成叙事连贯、音画同步的高质量MV,号称具备工业级稳定品质。该工具基于多智能体协作系统,包括导演智能体解析音乐与歌词、分镜脚本智能体制定详细拍摄计划、视觉生成智能体保持画面一致性,以及剪辑与合成智能体完成镜头节奏和字幕同步。此外,Vidu支持上传最多7张参考图,可在长达5分钟的视频中精确复刻人物特征与风格。整个过程全自动,数分钟内输出完整成片,打造端到端的虚拟制片厂体验。
原文链接
正文:2025年12月1日,国产AI工具Vidu推出全新升级版Q2功能,包括参考生图、文生图和图像编辑等。其参考生图功能号称业界最强一致性,可精准复刻人物、物体、动作等细节,生成4K高清图片。新增的文生图功能支持一句话生成四宫格漫画或艺术插画,而图像编辑功能则可通过自然语言快速修改图片比例、场景或细节,操作媲美简化版PS。此外,Vidu提供一站式多参工作流,用户可在同一界面完成从生图到生视频的全流程创作。目前,这些功能限时免费开放,旗舰版会员无限量使用,标准版和专业版每月享300张免费额度。Vidu已跻身AA榜单图像编辑功能第四名,超越OpenAI,与Google、Bytedance齐名。注册邀请码QBITAIQ2可获100积分福利。
原文链接
10月21日,Vidu Q2携三大核心功能全球上线,掀起AI视频创作新革命。新增「参考生」功能,支持高一致性、多主体生成及复杂运镜,推理速度较上一代快3倍,画质达1080P高清,且价格更优惠。同时推出视频延长功能,免费用户可生成最长30秒视频,付费用户最高延长至5分钟。Vidu APP全面升级为一站式AI内容社交平台,新增“二次创作”功能,用户可通过@主体+一句话生成创意视频,并内置海量素材库。全新版本将于10月21日上线官网及各大应用平台,搜索“Vidu AI”即可体验。
原文链接
标题:Sora2与国产Vidu Q2对决,国产参考生更胜一筹?
正文:
国庆期间,Sora 2的“客串”功能引发热议,被称为“AI版抖音”。然而,类似玩法在国内早有先例。最近火爆的“秒变风格”视频功能来自Vidu的“参考生”,其最新模型Vidu Q2已是第五代迭代版本。
上传一张奥特曼照片,Vidu...
原文链接
9月19日,生数科技宣布完成数亿元人民币A轮融资,由博华资本领投,百度战投、启明创投等跟投。资金将用于多模态大模型研发及全球商业布局。公司核心产品Vidu系列覆盖视频、图片和音频生成能力,其参考生图功能支持7张参考图输入,突破多主体一致性难题。上线8个月,Vidu年度经常性收入突破2000万美元,业务覆盖200+国家和地区,生成视频超4亿。生数科技与京东、亚马逊、荣耀等头部企业达成合作,商业化布局领先行业。新一轮融资标志资本市场对多模态赛道的认可,或推动AI视频生成市场新格局。
原文链接
标题:实测“电商神器” Vidu 参考生图:有素材就能拼出任何图片
正文:
在大模型的进化中,多模态技术逐步从文字迈向视频和空间领域。视频生成作为“皇冠上的明珠”,不仅要求单帧画面精美,还需保持时序连贯性。Vidu凭借其在视频生成领域的突破,引发了对其静态图像能力的期待。
9月9日,生数科技...
原文链接
2025年9月10日,国产AI模型Vidu Q1参考生图正式上线,支持同时上传7张参考图,超越Nano Banana的3张限制。其实测表现优异,主体一致性能力评分全场最佳,可生成多种创意图像,如历史人物与现代场景结合、时尚大片及多人合照等。该工具具备高操作性,可通过自然语言描述或直接生成复杂画面,适合在线试衣、手办设计、主体替换等多场景应用。目前分辨率仅支持1080p,最多一次生成4张图片,已全球同步上线。
原文链接
加载更多
暂无内容