
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
7月18日,Mistral AI为其聊天机器人Le Chat推出多项新功能,包括深度搜索(Deep Research)、推理模式(Think Mode)、语音输入模式及文生图二次编辑功能,现已上线网页版与移动App,并开放免费试用。深度搜索可分解用户问题,联网查找可靠信息,生成带来源的条理化报告,类似ChatGPT等产品。新增的语音输入支持英语、西班牙语等多种语言,基于Voxtral语音模型。此外,Le Chat还引入“项目(Projects)”功能,集中管理对话和任务,支持上传文件、调取文档,适用于长期任务管理。
原文链接
Mistral AI于3月6日推出了Mistral OCR API,宣称其在光学字符识别领域最快最准。该API能处理复杂文档,包括PDF、幻灯片及学术文档,支持数千种脚本、字体和语言。识别结果以Markdown形式呈现。据Mistral AI称,该模型在多项测试中超越了谷歌Document AI、微软Azure OCR及OpenAI GPT-4等竞争对手。定价为每千页1美元,单节点每分钟可处理2000页。此技术已应用于历史文化遗产保护等领域。
原文链接
Mistral AI 于11月24日更新了旗下聊天机器人Le Chat,引入了全新多模态模型Pixtral Large。该模型基于Mistral Large 2打造,拥有1240亿参数,不仅具备强大的文本理解能力,还能解析文档、图表及自然图像。在MathVista、ChartQA和DocVQA等多项基准测试中,Pixtral Large表现出色,超越了Llama-3.2 90B、GPT-4o和Gemini-1.5 Pro等模型。此外,Le Chat还加入了Black Forest Labs Flux Pro模型,新增图像生成能力,并引入了Canvas界面,使用户能用AI创建文档、演示文稿及各类代码。Mistral AI强调,Le Chat是唯一支持任务代理、文档/图像分析、图像生成并具备网络搜索功能的免费AI聊天机器人,具有行业领先地位。
原文链接
正文:今日凌晨,法国开源大模型平台Mistral.ai发布了最强开源多模态模型Pixtral Large,该模型拥有1240亿参数,支持128K上下文,能处理文本、图表、图像等多种数据,涵盖中、英、法等十余种语言。测试显示,Pixtral Large在MMMU、MathVista、ChartQA等多项基准测试中超越了GPT-4o、Gemini-1.5 Pro等模型。同时,Mistral.ai还发布了免费的多模态AI助手le Chat,支持PDF理解、网络搜索、Canvas、AI Agent、图片生成等功能。Pixtral Large采用先进的变换器架构和自注意力机制,支持多图像处理和长上下文窗口。le Chat新增了网络搜索、Canvas、PDF处理及图像生成功能,提升了工作效率和用户体验。开源地址:,体验地址:。
原文链接
加载更多

暂无内容