1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
这是我花9毛钱拍的《Meta老板砸钱把我从苹果挖走》
标题:9毛钱拍出《Meta老板砸钱把我从苹果挖走》 正文: 国产AI视频生成技术已进入全新阶段,仅需9毛钱和4张图片,就能制作出精良的短视频。以《Meta老板砸钱把我从苹果挖走》为例,这并非传统的“图生视频”,而是更灵活的创作方式。以往的AI工具只能基于首尾帧生成视频,细节难以把控,而现在的技术...
未来编码者
07-14 14:23:28
AI视频生成
Vidu Q1参考生视频
一致性
分享至
打开微信扫一扫
内容投诉
生成图片
AI也有幸运数字!从1-50随机选数字:各家答案竟惊人一致
7月2日,快科技报道,当被要求在1到50之间随机选择一个数字时,OpenAI的ChatGPT、Anthropic的Claude Sonnet 4、谷歌的Gemini 2.5 Flash和Meta的Llama 4等主流AI模型不约而同选择了27。这一现象可能源于相似的训练数据和语言习惯,导致模型在预测时表现出一致性。测试显示,多数模型在不同范围内有固定的偏好数字,如1-10中倾向选7,1-5中偏好3或4,且多数为质数。该现象由数据科学家Mohd Faraaz首次发现,仅Grok选择了42。
数据炼金师
07-02 19:10:00
ai
数字偏好
模型一致性
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰开源图像编辑模型 Step1X-Edit:身份一致性保持、区域级控制
4月27日,阶跃星辰开源图像编辑大模型Step1X-Edit,参数量达19B,性能达开源SOTA。该模型具备语义精准解析、身份一致性保持及高精度区域级控制三大能力,支持文字替换、风格迁移等11类高频图像编辑任务。Step1X-Edit可灵活处理多轮、多任务编辑需求,保留人脸、姿态等身份特征,实现精确的区域编辑与风格统一。开源地址:Github、HuggingFace、ModelScope、技术报告。
阿达旻
04-27 12:13:44
Step1X-Edit
图像编辑
身份一致性
分享至
打开微信扫一扫
内容投诉
生成图片
可媲美GPT-4o的开源图像生成框架来了!腾讯联手InstantX解决角色一致性难题
可媲美GPT-4o的开源图像生成框架来了!腾讯联手InstantX解决角色一致性难题 腾讯混元与InstantX团队合作推出开源插件InstantCharacter,实现定制化角色生成。该插件基于DiTs(Diffusion Transformers),能高效生成并编辑个性化角色图像。 传统方法存在...
数字墨迹
04-25 17:17:07
InstantCharacter
开源图像生成框架
角色一致性
分享至
打开微信扫一扫
内容投诉
生成图片
Runway Gen-4深夜发布,终于捅破AI视频多年的天花板
Runway Gen-4深夜发布,捅破AI视频多年天花板 这是一个导演酝酿十余年的梦想,如今借助AI得以实现。此前,用AI完成此视频需解决角色连贯性、情感细腻度、物理真实感及叙事连续性等难题。Runway Gen-4的到来改变了这一切,这款号称全球首款“世界一致性”模型,让用户能在多个场景中保持...
代码编织者Nexus
04-01 09:19:50
AI视频生成
Runway Gen-4
世界一致性
分享至
打开微信扫一扫
内容投诉
生成图片
只给一张Doge图,GPT-4o就帮我画好一整个RPG游戏
标题:只给一张Doge图,GPT-4o就画出整个RPG游戏 正文:观察发现,GPT-4o具备主体关系控制、多视图生成、风格迁移、知识理解、多轮对话编辑、多元素一致稳定性控制及复杂文字嵌入等能力,核心在于精准指令遵循与生成可靠性。OpenAI CEO Sam Altman称其开启创作自由新高峰。为...
智慧棱镜
03-31 20:50:34
GPT-4o
RPG游戏
图像一致性
分享至
打开微信扫一扫
内容投诉
生成图片
Meta 新视频生成框架 VideoJAM 拿捏倒立杂技,双人舞也能完美同步
Meta GenAI团队推出新视频生成框架VideoJAM,能完美呈现复杂舞蹈、倒立等动作。VideoJAM基于DiT路线,无需额外数据即可提升运动效果。它在4B和30B规模的DiT模型上,运动质量分别提升了19.67%和4.88%,超过Sora、Gen3等模型。VideoJAM通过引入联合外观-运动表示和内部引导机制,实现了更好的运动一致性和视频质量。详情见论文及项目主页
AGI探路者
02-10 13:10:47
DiT模型
VideoJAM
运动一致性
分享至
打开微信扫一扫
内容投诉
生成图片
Meta新视频生成框架拿捏倒立杂技,双人舞也能完美同步!运动一致性暴增近20%,可无缝集成DiT模型
Meta新视频生成框架VideoJAM解决运动一致性难题,优于Sora和Gen3。该框架基于DiT模型,能无缝集成并提升运动效果近20%。它能在生成视频时同步处理复杂动作,如双人同步舞蹈、倒立等。VideoJAM在处理运动场景时,不仅能更好地呈现视觉效果,还符合物理规律。例如,视频中的蜡烛火焰、书法笔迹及史莱姆形状的变化都能细致展现。 VideoJAM通过在训练阶段引入“联合外观-运动表示”,使模型在生成视频时同时学习预测运动。此外,它采用“内部引导机制”在推理阶段增强运动一致性。这种机制利用模型自身预测的运动信息动态调整生成过程,确保动作连贯。实验表明,VideoJAM在4B和30B规模下的运动质量分别提升了19.67%和4.88%,显著优于其他模型。
虚拟微光
02-10 13:07:29
DiT模型
VideoJAM
运动一致性
分享至
打开微信扫一扫
内容投诉
生成图片
字节即梦 AI 视频生成模型更新 P / S 2.0 Pro 双版本,全量开放使用
11月15日,字节跳动旗下AI平台“即梦AI”宣布推出两款全新视频生成模型P2.0 Pro和S2.0 Pro,并已全量上线。S2.0 Pro在图像转视频场景中表现出色,具备优秀的首帧一致性,能精准还原用户输入图片的细节。P2.0 Pro则以高度的提示词遵循能力著称,能够处理复杂提示词,在单一镜头内实现多镜头切换和组合,同时保持视频风格和氛围的一致性。用户现可通过即梦App或访问其官网体验这两款新模型。
灵感Phoenix
11-15 19:03:43
即梦AI
视频生成模型
首帧一致性
分享至
打开微信扫一扫
内容投诉
生成图片
清华大佬整活:马斯克穿上东北大花袄、李白穿上背带裤
清华团队与生数科技合作推出视频模型Vidu 1.5,该模型具备多主体一致性功能,能生成高质量视频。近期,Vidu 1.5被用来生成一系列趣味视频,包括马斯克穿上东北大花袄站在白宫前、李白穿上背带裤打篮球等。这些视频展示了Vidu 1.5的强大功能,用户只需上传多张图片,即可生成连贯一致的视频内容。尽管Vidu 1.5在处理复杂场景时仍存在一些问题,如动作不连贯或细节失真,但它依然受到广泛关注,被认为是AI视频生成领域的一大进步。用户可以在Vidu官网体验这一功能,目前有免费试用次数限制。 摘要中保留了关键信息,如时间、地点、事件等,并突出了新技术的特点和潜在应用价值。
DreamCoder
11-15 09:49:53
AI生成视频
Vidu 1.5
多主体一致性
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序