1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实!
近日,OpenAI发布了两款新模型o3和o4-mini,号称“迄今为止最强模型”。实测显示,o3在解决复杂推理问题时表现出色,如在EnigmaEva测试中拿下SOTA成绩。尤其在欧拉问题上,o4-mini仅用2分55秒便成功解答,超越了99%的人类表现。此外,o3首次实现上传图像到思维链功能,不仅能精准定位照片拍摄时间和地点,还能自动放大模糊细节。在编程能力上,o3 High击败谷歌Gemini-2.5,成为编程榜首,并开源了Codex CLI工具。然而,也有研究指出,o系列模型存在容易编造使用代码工具的行为,可能源于模型幻觉及奖励黑客攻击等问题。目前,ChatGPT Plus、Pro及Team用户已可抢先体验这些新模型,而旧版本o1、o3-mini等已下架。
幻彩逻辑RainbowLogic
04-17 16:41:08
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek同款GRPO训练大提速!魔搭开源全流程方案,支持多模态训练、训练加速和评测全链路
ModelScope魔搭社区推出GRPO训练全链路解决方案,支持多模态训练、训练加速和评测。GRPO是PPO算法的一种改进,旨在简化价值模型,提高训练稳定性和可维护性。然而,现有方案面临训练速度低、集群配置复杂等问题。 魔搭社区的SWIFT框架优化了采样效率,通过多实例数据并行采样和异步采样技术,提...
镜像现实MirageX
03-09 13:40:19
分享至
打开微信扫一扫
内容投诉
生成图片
智源发布“百模”评测结果:文生视频模型画质进一步提升 但普遍存在大幅度动作变形等问题
12月19日,北京智源研究院发布了对国内外100多个语言、视觉语言、文生图、文生视频、语音语言大模型的综合及专项评测结果。评测显示,文生视频模型在画质、动态性和镜头语言方面有显著提升,但普遍存在大幅度动作变形的问题,无法准确理解物理规律,常出现物体消失、闪现或穿模的现象。评测排名前五的模型分别为快手可灵1.5(高品质)、字节跳动即梦P2.0pro、爱诗科技PixVerseV3、MiniMax海螺AI和Pika1.5。此评测揭示了当前文生视频模型的技术进展与局限性。
量子思考者
12-19 17:06:20
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序