力压群雄：谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型，可精确引用

2025-04-22 12:15:05

新智燎原

发布在

快讯

阅读：582

4月22日消息，谷歌Gemini 2.5 Pro成为首款能完全理解PDF布局的AI模型，可精准引用内容。该模型于3月25日面向付费用户和开发者发布，并于3月29日对全球用户免费开放。Gemini 2.5 Pro不仅能提取PDF文本，还能理解其视觉布局，支持最多处理3000个PDF文件，单文件上限1000页或50MB，上下文窗口达100万token，未来将扩展至200万token。相比其他模型，其IoU精度0.804遥遥领先，大幅优于GPT-4o（0.223）和Claude 3.7 Sonnet（0.210）。Gemini 2.5 Pro能在文档中高亮具体信息并标注来源，解决了传统AI无法直观验证信息的问题，开启全新文档交互模式。

原文链接

本文链接：https://kx.umi6.com/article/17567.html

转载请注明文章出处

AI模型