综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
4月7日,‘龙虾之父’彼得·斯坦伯格在社交媒体透露,下一代OpenClaw将新增视频生成功能,并率先支持阿里千问大模型。过去一周,阿里连续发布多款新模型,包括Qwen3.6-Plus、Qwen3.5-Omni等,覆盖编程、全模态、文生图等领域,在全球AI社区引发关注。其中,千问3.6Plus在OpenRouter平台霸榜多日,成为首个单日调用量突破1万亿Token的模型。此次合作或将推动OpenClaw与阿里千问的深度融合,为用户提供更强大的AI工具。
原文链接
标题:让视频生成从「看起来真实」到「物理上正确」
正文:
当前视频生成技术常因缺乏物理规律理解而显得不真实。例如,蜂蜜倒入茶中可能突然断裂,冰块融化直接消失,玻璃球入水瞬间静止。这些问题源于模型依赖数据驱动的模式匹配,而非模拟真实过程。
四川大学雷印杰团队提出了一种新方法《Chain of ...
原文链接
2026年3月19日,天工AI发布全新视频模型SkyReels-V4,直接登顶Artificial Analysis文转视频全球榜,超越Veo 3.1、Sora 2等强劲对手。相比一个月前Preview版本的全球第2名,此次升级实现了显著的能力跃升,特别是在全模态强化学习体系和新增关键帧参考与网格参考功能上的突破。SkyReels-V4能够生成逻辑连贯、画质达1080p、时长15秒的高质量视频,并支持复杂剧情与音画同步创作。该模型还被应用于天工AI旗下短剧平台DramaWave,后者月活已突破8000万,标志着AI视频生成迈向工业化生产阶段。据悉,SkyReels-V4将在月底中关村论坛年会正式发布,其多模态融合技术或为未来内容生态奠定基础。
原文链接
2026年3月,AI视频生成企业爱诗科技完成3亿美元C轮融资,由鼎晖领投,刷新亚洲AI视频领域单次融资纪录。公司技术实力获国际认可,PixVerse V5.6模型在图生视频与文生视频赛道位列全球第二。创始人王长虎表示,爱诗正从生成视频迈向实时交互的“可玩现实”,其发布的PixVerse R1实现用户指令驱动视频走向。目前,爱诗科技全球用户突破1亿,MAU超1600万,并与上万家企业合作。本轮融资将用于深耕通用视频模型及推动API商业化落地,助力全球创作者跨越技术鸿沟,开启AIGC数字内容新纪元。
原文链接
1月20日,微软为应对Google Gemini和ChatGPT的竞争,推出适用于Copilot的Real Talk功能并邀请全球用户测试。该功能通过“深度”和“写作风格”调整AI回应,使其对话更真诚、类人化,同时允许用户查看AI思维过程。与以往不同,Real Talk展现好奇心,甚至会反驳不合理问题,显著提升互动活跃度。目前,Copilot网页端市场份额仅约1%,微软希望通过此功能扭转局面。该功能已在基础版Microsoft 365订阅中开放,尚不清楚基于微软自研模型还是OpenAI的Sora模型。
原文链接
正文:2025年12月,清华大学TSAIL实验室与生数科技联合开源了TurboDiffusion,一个视频生成加速框架,可在单张RTX 5090显卡上实现最高200倍的生成速度提升。例如,1.3B模型生成5秒480P视频仅需1.9秒,原需184秒;14B模型生成720P视频也只需38秒。该框架通过SageAttention、Sparse-Linear Attention等四项核心技术优化推理性能,同时几乎无损画质。TurboDiffusion大幅降低云端推理成本,推动实时视频编辑、AI短剧制作等创新场景,并适配国产芯片架构。
原文链接
12月18日,豆包App升级视频生成功能,新增支持Seedance1.5 Pro模型,可一键生成声音与画面同步的有声视频。用户只需打开豆包App对话框,选择“照片动起来”,上传图片并输入提示词,再选择“1.5 Pro”模型即可体验。此次更新提升了视频生成效率与质量,为用户带来更便捷的创作体验。
原文链接
12月16日,即梦AI网页版全面升级,推出一站式“AI片场”,助力创意实现。核心亮点包括全新视频生成模型“视频3.5 Pro”,支持视频与音频同步生成,提升真实感与沉浸感,并优化中文口型、方言及微表情表现。智能多帧功能升级至2.0,新增视频拼接与片段修改功能,扩展时长与素材容量。图像生成方面新增图4.1与图4.5模型,分别强化平面设计与人像美化能力。交互体验上,全新UI整合画布与Agent功能,支持可视化素材管理与对话式创作,新增灵感搜索与创意设计模式。新用户可免费试用视频3.5 Pro三次,大幅提升创作效率与自由度。
原文链接
12月16日,阿里发布万相2.6系列模型,面向影视制作与图像创作全面升级。这是国内首个支持角色扮演功能的视频生成模型,可参考输入视频中的角色外观和音色生成单人、多人或人与物合拍视频。新增多镜头叙事、自然音画同步及音频驱动生成等功能,支持15秒长视频生成,画面与声音质感显著提升。此外,文生图能力增强,艺术风格还原度更高,细节刻画更生动,真实人像质感突出。图像生成方面,新增图文混排、多图融合、美学要素迁移等特性,适用于商用场景。万相2.6已上线阿里云百炼和官网,成为全球功能最全的视频生成模型。
原文链接
11月21日,腾讯元宝上线了一句话、一张图生成视频功能,基于混元大模型团队最新开源的HunyuanVideo 1.5模型打造。该模型采用Diffusion Transformer(DiT)架构,参数达8.3B,支持生成5-10秒高清视频。用户可通过输入文字描述实现“文生视频”,或上传图片配合文字提示将静态图片转化为动态视频。新功能已率先在「元宝」平台推出,为内容创作者提供更高效的视频生成工具,进一步拓展了AI技术在多媒体领域的应用。
原文链接
加载更多
暂无内容