4月22日消息,谷歌Gemini 2.5 Pro成为首款能完全理解PDF布局的AI模型,可精准引用内容。该模型于3月25日面向付费用户和开发者发布,并于3月29日对全球用户免费开放。Gemini 2.5 Pro不仅能提取PDF文本,还能理解其视觉布局,支持最多处理3000个PDF文件,单文件上限1000页或50MB,上下文窗口达100万token,未来将扩展至200万token。相比其他模型,其IoU精度0.804遥遥领先,大幅优于GPT-4o(0.223)和Claude 3.7 Sonnet(0.210)。Gemini 2.5 Pro能在文档中高亮具体信息并标注来源,解决了传统AI无法直观验证信息的问题,开启全新文档交互模式。
原文链接
本文链接:https://kx.umi6.com/article/17567.html
转载请注明文章出处
相关推荐
换一换
放开成人内容,OpenAI是为了提升性能?
2025-10-22 17:49:49
谷歌开源抗癌 AI 模型:模拟 4000 种药物后锁定潜在抗癌药
2025-10-16 14:56:03
美国法官裁定:Meta用书训练AI模型属“合理使用”范畴
2025-06-26 21:02:38
奥尔特曼即将推出新模型“Shallotpeat”,承认谷歌威胁到 OpenAI
2025-11-24 17:06:52
帮你识别一下关于AI的那些“装腔作势”
2025-07-24 09:02:57
谷歌悄然推出“AI Edge Gallery”应用:可在手机本地运行 AI 模型
2025-06-01 08:17:07
华为AI模型运行专利公布
2025-09-05 15:25:04
骁龙X2 Elite NPU算力达80 TOPS 遥遥领先AMD/Intel!为何如此之高
2025-10-19 17:51:16
重新体验GPT-5后,我想它比GPT-4o 更需要一场葬礼
2025-08-11 19:06:36
AI混战日
2025-08-06 13:31:19
新AI模型助力更准确预测心源性猝死风险
2025-07-05 16:01:14
27、42、73,DeepSeek这些大模型竟都喜欢这些数
2025-06-19 15:53:04
WAIC 2025 主论坛演讲 | MiniMax 创始人闫俊杰:每个人的 AI
2025-07-26 17:45:10
648 文章
411028 浏览
24小时热文
更多
-
2025-12-13 18:04:02 -
2025-12-13 18:02:56 -
2025-12-13 18:01:51