
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:9毛钱拍出《Meta老板砸钱把我从苹果挖走》
正文:
国产AI视频生成技术已进入全新阶段,仅需9毛钱和4张图片,就能制作出精良的短视频。以《Meta老板砸钱把我从苹果挖走》为例,这并非传统的“图生视频”,而是更灵活的创作方式。以往的AI工具只能基于首尾帧生成视频,细节难以把控,而现在的技术...
原文链接
7月2日,快科技报道,当被要求在1到50之间随机选择一个数字时,OpenAI的ChatGPT、Anthropic的Claude Sonnet 4、谷歌的Gemini 2.5 Flash和Meta的Llama 4等主流AI模型不约而同选择了27。这一现象可能源于相似的训练数据和语言习惯,导致模型在预测时表现出一致性。测试显示,多数模型在不同范围内有固定的偏好数字,如1-10中倾向选7,1-5中偏好3或4,且多数为质数。该现象由数据科学家Mohd Faraaz首次发现,仅Grok选择了42。
原文链接
4月27日,阶跃星辰开源图像编辑大模型Step1X-Edit,参数量达19B,性能达开源SOTA。该模型具备语义精准解析、身份一致性保持及高精度区域级控制三大能力,支持文字替换、风格迁移等11类高频图像编辑任务。Step1X-Edit可灵活处理多轮、多任务编辑需求,保留人脸、姿态等身份特征,实现精确的区域编辑与风格统一。开源地址:Github、HuggingFace、ModelScope、技术报告。
原文链接
可媲美GPT-4o的开源图像生成框架来了!腾讯联手InstantX解决角色一致性难题
腾讯混元与InstantX团队合作推出开源插件InstantCharacter,实现定制化角色生成。该插件基于DiTs(Diffusion Transformers),能高效生成并编辑个性化角色图像。
传统方法存在...
原文链接
Runway Gen-4深夜发布,捅破AI视频多年天花板
这是一个导演酝酿十余年的梦想,如今借助AI得以实现。此前,用AI完成此视频需解决角色连贯性、情感细腻度、物理真实感及叙事连续性等难题。Runway Gen-4的到来改变了这一切,这款号称全球首款“世界一致性”模型,让用户能在多个场景中保持...
原文链接
标题:只给一张Doge图,GPT-4o就画出整个RPG游戏
正文:观察发现,GPT-4o具备主体关系控制、多视图生成、风格迁移、知识理解、多轮对话编辑、多元素一致稳定性控制及复杂文字嵌入等能力,核心在于精准指令遵循与生成可靠性。OpenAI CEO Sam Altman称其开启创作自由新高峰。为...
原文链接
Meta GenAI团队推出新视频生成框架VideoJAM,能完美呈现复杂舞蹈、倒立等动作。VideoJAM基于DiT路线,无需额外数据即可提升运动效果。它在4B和30B规模的DiT模型上,运动质量分别提升了19.67%和4.88%,超过Sora、Gen3等模型。VideoJAM通过引入联合外观-运动表示和内部引导机制,实现了更好的运动一致性和视频质量。详情见论文及项目主页
原文链接
Meta新视频生成框架VideoJAM解决运动一致性难题,优于Sora和Gen3。该框架基于DiT模型,能无缝集成并提升运动效果近20%。它能在生成视频时同步处理复杂动作,如双人同步舞蹈、倒立等。VideoJAM在处理运动场景时,不仅能更好地呈现视觉效果,还符合物理规律。例如,视频中的蜡烛火焰、书法笔迹及史莱姆形状的变化都能细致展现。
VideoJAM通过在训练阶段引入“联合外观-运动表示”,使模型在生成视频时同时学习预测运动。此外,它采用“内部引导机制”在推理阶段增强运动一致性。这种机制利用模型自身预测的运动信息动态调整生成过程,确保动作连贯。实验表明,VideoJAM在4B和30B规模下的运动质量分别提升了19.67%和4.88%,显著优于其他模型。
原文链接
11月15日,字节跳动旗下AI平台“即梦AI”宣布推出两款全新视频生成模型P2.0 Pro和S2.0 Pro,并已全量上线。S2.0 Pro在图像转视频场景中表现出色,具备优秀的首帧一致性,能精准还原用户输入图片的细节。P2.0 Pro则以高度的提示词遵循能力著称,能够处理复杂提示词,在单一镜头内实现多镜头切换和组合,同时保持视频风格和氛围的一致性。用户现可通过即梦App或访问其官网体验这两款新模型。
原文链接
清华团队与生数科技合作推出视频模型Vidu 1.5,该模型具备多主体一致性功能,能生成高质量视频。近期,Vidu 1.5被用来生成一系列趣味视频,包括马斯克穿上东北大花袄站在白宫前、李白穿上背带裤打篮球等。这些视频展示了Vidu 1.5的强大功能,用户只需上传多张图片,即可生成连贯一致的视频内容。尽管Vidu 1.5在处理复杂场景时仍存在一些问题,如动作不连贯或细节失真,但它依然受到广泛关注,被认为是AI视频生成领域的一大进步。用户可以在Vidu官网体验这一功能,目前有免费试用次数限制。
摘要中保留了关键信息,如时间、地点、事件等,并突出了新技术的特点和潜在应用价值。
原文链接
加载更多

暂无内容