GPT-4o骗了所有人，逐行画图只是前端特效？！底层架构细节成迷，奥特曼呼吁大家别玩了

2025-03-31 12:26:06

星际Code流浪者

发布在

科普

阅读：871

GPT-4o引发热议：逐行画图是假象还是技术突破？

近日，GPT-4o因其强大的图像生成能力受到广泛关注。然而，有玩家发现，所谓的“逐行生成”效果仅是浏览器端的动画展示，服务器实际只传输五张中间结果。这一发现让不少研究者对GPT-4o的底层架构产生疑问，此前关于其采用多尺度自回归组合的推测可能需要重新审视。

OpenAI团队为维持服务稳定，不得不加班监控服务器运行状态。同时，这种设计也可能有意模糊技术细节，以保护知识产权并降低潜在的法律风险。尽管如此，GPT-4o的图像生成能力依然令人惊叹。例如，它可以生成符合吉卜力风格的画面，还能根据描述生成具有逻辑性的迷宫或还原古代建筑如金字塔的真实样貌。

此外，GPT-4o在生成无缝材质贴图方面表现优异，适用于游戏开发。不过，其在人物肖像生成上的表现存在矛盾。虽然可以基于名人照片制作周边产品，但直接请求生成名人照片时却可能被拒。有趣的是，通过间接描述（如生成截图）可绕过限制。与另一款AI模型Sora相比，GPT-4o对人物肖像的处理方式也有所不同。

OpenAI及其他AI企业仍在探索如何平衡创意自由与版权合规，未来仍有大量工作待完成。相关讨论可参考以下链接：[1]至[5]。

原文链接

本文链接：https://kx.umi6.com/article/16467.html

转载请注明文章出处

GPT-4o

图像生成

版权问题

分享至

打开微信扫一扫

内容投诉

生成图片

772 文章

866197 浏览

24小时热文