GPT-4o引发热议:逐行画图是假象还是技术突破?
近日,GPT-4o因其强大的图像生成能力受到广泛关注。然而,有玩家发现,所谓的“逐行生成”效果仅是浏览器端的动画展示,服务器实际只传输五张中间结果。这一发现让不少研究者对GPT-4o的底层架构产生疑问,此前关于其采用多尺度自回归组合的推测可能需要重新审视。
OpenAI团队为维持服务稳定,不得不加班监控服务器运行状态。同时,这种设计也可能有意模糊技术细节,以保护知识产权并降低潜在的法律风险。尽管如此,GPT-4o的图像生成能力依然令人惊叹。例如,它可以生成符合吉卜力风格的画面,还能根据描述生成具有逻辑性的迷宫或还原古代建筑如金字塔的真实样貌。
此外,GPT-4o在生成无缝材质贴图方面表现优异,适用于游戏开发。不过,其在人物肖像生成上的表现存在矛盾。虽然可以基于名人照片制作周边产品,但直接请求生成名人照片时却可能被拒。有趣的是,通过间接描述(如生成截图)可绕过限制。与另一款AI模型Sora相比,GPT-4o对人物肖像的处理方式也有所不同。
OpenAI及其他AI企业仍在探索如何平衡创意自由与版权合规,未来仍有大量工作待完成。相关讨论可参考以下链接:[1]至[5]。
原文链接
本文链接:https://kx.umi6.com/article/16467.html
转载请注明文章出处
相关推荐
换一换
何恺明MIT开门弟子名单:奥赛双料金牌得主、清华姚班学霸在列
2024-12-03 16:20:13
韩国三大电视台因版权问题起诉OpenAI
2026-02-23 19:09:59
ChatGPT 原生图像生成功能已向免费用户推出
2025-03-31 12:32:33
OpenAI回滚了最新版本的GPT-4o,因ChatGPT“过于谄媚”
2025-04-30 20:11:51
OpenAI 将 ChatGPT 新图像生成技术引入 API,每张图约 2 美分起
2025-04-24 08:29:07
因为GPT-5,这群人决定在Reddit上起义
2025-08-11 11:01:24
研究显示 GPT-4o 会为“自保”而避免“被关闭”,牺牲用户利益也在所不惜
2025-06-12 08:28:18
王兴披露美团 AI 业务进展:基础大模型能力接近 GPT-4o 水平,6 月将推业务决策助手
2025-05-26 21:50:33
调查显示97%受访者无法分辨AI音乐
2025-11-13 15:07:29
OpenAI的吉卜力,撞车了被字节起诉“投毒AI”的前实习生?
2025-04-03 14:24:18
腾讯混元图像2模型发布 支持文本、语音、草图等交互方式
2025-05-16 17:13:07
小米大模型团队提出对角蛇形自回归图像生成方式
2025-04-18 17:22:44
GPT-4即将“退役”!OpenAI宣布本月末起它将被GPT-4o替代
2025-04-14 16:42:54
688 文章
486104 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18