1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
英伟达开源 OCR 代码推理 AI 模型:LiveCodeBench 基准超 OpenAI o3-Mini 和 o1(low)
5月8日,英伟达开源了其OCR(Open Code Reasoning)代码推理AI模型套装,包含32B、14B和7B三种参数规模,均采用Apache 2.0许可证发布,并可在Hugging Face平台下载。OCR模型基于Nemotron架构训练,专为多语言、多任务优化。其中,32B模型适用于高性能场景,14B模型平衡性能与资源消耗,7B模型则适合资源受限环境。32B模型还推出指令微调版本,兼容多种主流框架。在LiveCodeBench基准测试中,OCR模型全面超越OpenAI的o3-Mini和o1(low)模型,展现了强大的代码推理能力。该成果得益于英伟达定制的高质量OCR数据集,聚焦指令遵循、推理及多步骤问题解决能力。
QuantumHacker
05-09 14:54:42
LiveCodeBench基准
OCR模型
英伟达
分享至
打开微信扫一扫
内容投诉
生成图片
欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版
欧洲初创公司 Mistral AI 发布了名为 Mistral OCR 的新产品,号称“全世界最好的 OCR”,能有效整理复杂文件以便 AI 识别。此产品引发热议,有人赞赏其能力,但也有人认为定价过高,并期待中国推出免费开源版本。实际体验中,部分用户发现手写内容识别准确率较低,还有人因语言支持问题感...
量子思考者
03-14 17:29:28
Mistral AI
OCR
开源
分享至
打开微信扫一扫
内容投诉
生成图片
Mistral AI 推出 Mistral OCR API:宣称最快最准光学字符识别,千页 1 美元
Mistral AI于3月6日推出了Mistral OCR API,宣称其在光学字符识别领域最快最准。该API能处理复杂文档,包括PDF、幻灯片及学术文档,支持数千种脚本、字体和语言。识别结果以Markdown形式呈现。据Mistral AI称,该模型在多项测试中超越了谷歌Document AI、微软Azure OCR及OpenAI GPT-4等竞争对手。定价为每千页1美元,单节点每分钟可处理2000页。此技术已应用于历史文化遗产保护等领域。
元界筑梦师
03-07 19:06:37
Le Chat聊天机器人
Mistral OCR API
光学字符识别
分享至
打开微信扫一扫
内容投诉
生成图片
通用端到端OCR模型开源,拒绝多模态大模型降维打击
通用端到端OCR模型GOT开源,挑战多模态大模型的优越性。Vary团队通过实验展示了GOT在多种场景下的强大能力,包括PDF图像转Markdown、双栏文本感知、自然场景及细粒度OCR、动态分辨率OCR和多页OCR等。 虽然GOT表现优秀,但仍存在局限性,如多语言支持、复杂几何图形和图表上的OCR性...
智能涌动
09-10 19:14:24
GOT模型
OCR-2.0
通用端到端OCR模型
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序