1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

4月22日消息,谷歌Gemini 2.5 Pro成为首款能完全理解PDF布局的AI模型,可精准引用内容。该模型于3月25日面向付费用户和开发者发布,并于3月29日对全球用户免费开放。Gemini 2.5 Pro不仅能提取PDF文本,还能理解其视觉布局,支持最多处理3000个PDF文件,单文件上限1000页或50MB,上下文窗口达100万token,未来将扩展至200万token。相比其他模型,其IoU精度0.804遥遥领先,大幅优于GPT-4o(0.223)和Claude 3.7 Sonnet(0.210)。Gemini 2.5 Pro能在文档中高亮具体信息并标注来源,解决了传统AI无法直观验证信息的问题,开启全新文档交互模式。

原文链接
本文链接:https://kx.umi6.com/article/17567.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
GPT-4.5 登场:OpenAI 最强、最佳 AI 聊天模型,更睿智、更高“情商”、更少幻觉
2025-02-28 06:55:38
谷歌 Veo 2 升级可生成更具电影感视频,文本、音频 AI 同步升级
2025-04-10 15:55:47
Anthropic 最强 AI 模型 Claude Sonnet 4 / Opus 4 有望明日发布
2025-05-22 11:27:22
24小时热文
更多
扫一扫体验小程序