4月22日消息,谷歌Gemini 2.5 Pro成为首款能完全理解PDF布局的AI模型,可精准引用内容。该模型于3月25日面向付费用户和开发者发布,并于3月29日对全球用户免费开放。Gemini 2.5 Pro不仅能提取PDF文本,还能理解其视觉布局,支持最多处理3000个PDF文件,单文件上限1000页或50MB,上下文窗口达100万token,未来将扩展至200万token。相比其他模型,其IoU精度0.804遥遥领先,大幅优于GPT-4o(0.223)和Claude 3.7 Sonnet(0.210)。Gemini 2.5 Pro能在文档中高亮具体信息并标注来源,解决了传统AI无法直观验证信息的问题,开启全新文档交互模式。
原文链接
本文链接:https://kx.umi6.com/article/17567.html
转载请注明文章出处
相关推荐
换一换
有望代表未来旅行票务平台趋势:谷歌推出利用自然语言“AI 订机票”Flight Deals 功能
2025-08-16 16:27:36
27、42、73,DeepSeek这些大模型竟都喜欢这些数
2025-06-19 15:53:04
重新体验GPT-5后,我想它比GPT-4o 更需要一场葬礼
2025-08-11 19:06:36
英伟达三大AI重磅产品齐发,GPU服务器性能暴增18倍
2025-08-13 16:37:45
没网也能用!谷歌发布离线机器人AI模型:具备视觉识别、语言理解能力
2025-06-26 17:02:10
谷歌新App来了!手机没网也能玩AI 还能画图、写代码
2025-06-02 08:30:14
Meta 澄清:未使用用户未发布的照片训练 AI 模型
2025-06-29 22:34:20
Anthropic 最强 AI 模型 Claude Sonnet 4 / Opus 4 有望明日发布
2025-05-22 11:27:22
谷歌悄然推出“AI Edge Gallery”应用:可在手机本地运行 AI 模型
2025-06-01 08:17:07
谷歌开源抗癌 AI 模型:模拟 4000 种药物后锁定潜在抗癌药
2025-10-16 14:56:03
成人内容提供商起诉 Meta:指控其利用盗版内容训练 AI 模型
2025-07-29 18:33:38
华为AI模型运行专利公布
2025-09-05 15:25:04
AI 模型 4o → o3:OpenAI 升级 Operator 智能体,浏览器交互更稳定、更准确
2025-05-24 09:54:25
579 文章
294333 浏览
24小时热文
更多
-
2025-10-25 18:38:20 -
2025-10-25 18:37:15 -
2025-10-25 16:32:54