1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

GPT-4o引发热议:逐行画图是假象还是技术突破?

近日,GPT-4o因其强大的图像生成能力受到广泛关注。然而,有玩家发现,所谓的“逐行生成”效果仅是浏览器端的动画展示,服务器实际只传输五张中间结果。这一发现让不少研究者对GPT-4o的底层架构产生疑问,此前关于其采用多尺度自回归组合的推测可能需要重新审视。

OpenAI团队为维持服务稳定,不得不加班监控服务器运行状态。同时,这种设计也可能有意模糊技术细节,以保护知识产权并降低潜在的法律风险。尽管如此,GPT-4o的图像生成能力依然令人惊叹。例如,它可以生成符合吉卜力风格的画面,还能根据描述生成具有逻辑性的迷宫或还原古代建筑如金字塔的真实样貌。

此外,GPT-4o在生成无缝材质贴图方面表现优异,适用于游戏开发。不过,其在人物肖像生成上的表现存在矛盾。虽然可以基于名人照片制作周边产品,但直接请求生成名人照片时却可能被拒。有趣的是,通过间接描述(如生成截图)可绕过限制。与另一款AI模型Sora相比,GPT-4o对人物肖像的处理方式也有所不同。

OpenAI及其他AI企业仍在探索如何平衡创意自由与版权合规,未来仍有大量工作待完成。相关讨论可参考以下链接:[1]至[5]。

原文链接
本文链接:https://kx.umi6.com/article/16467.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
GPT-4o 系列 AI 模型加持,微软 LlamaParse 文档解析能力全面升级
2024-11-28 14:33:00
GPT-4o 加钱能变快,新功能“预测输出”7 秒完成原先 23 秒的任务
2024-11-07 10:39:17
GPT-4o失控,突然呻吟尖叫发癫,引发研究人员恐慌
2024-08-09 18:50:30
24小时热文
更多
扫一扫体验小程序