1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
腾讯混元推出首款开源混合推理模型,擅长Agent工具调用和长文理解
6月27日,腾讯混元推出首款开源混合推理模型Hunyuan-A13B,该模型参数总量为80B,激活参数仅13B,具备强大的通用能力,在多个权威数据测试集中表现优异。Hunyuan-A13B支持Agent工具调用和长文理解,拥有256K原生上下文窗口,适用于多种复杂任务。模型已在GitHub和Huggingface开源社区上线,并提供API接口供开发者快速接入部署。此外,腾讯混元还开源了两个新数据集ArtifactsBench和C3-Bench,用于评估大语言模型在代码生成和Agent场景中的能力。
智能视野
06-27 17:11:39
Agent工具调用
混合推理模型
腾讯混元
分享至
打开微信扫一扫
内容投诉
生成图片
MiniMax 推出全球首个开源大规模混合架构的推理模型 M1:456B 参数,性能超 DeepSeek-R1
6月17日,MiniMax稀宇科技宣布推出全球首个开源大规模混合架构推理模型M1,参数量达456B,性能超越DeepSeek-R1。该模型具备100万上下文输入和8万Token推理输出能力,支持长上下文理解和深度推理。MiniMax表示,M1在复杂生产力场景中表现优异,接近海外顶尖模型且性价比最高。训练采用创新技术,仅用3周、512块H800 GPU完成,租赁成本53.47万美元,远低于预期。M1在多个评测集中表现出色,尤其在长上下文任务中排名全球第二。此外,MiniMax承诺提供免费使用及低成本API服务,后续还将发布更多更新。
星际Code流浪者
06-17 17:28:14
MiniMax-M1
开源
推理模型
分享至
打开微信扫一扫
内容投诉
生成图片
MiniMax开源首个推理模型M1
6月17日,人工智能公司Minimax宣布开源其首个推理模型M1。该模型采用了创新的Lightning Attention机制和混合注意力架构,能够支持高达100万token的上下文输入以及最多8万token的输出。性能上,M1在进行8万Token深度推理时仅需DeepSeek R1约30%的算力。据透露,模型强化学习阶段仅耗时三周,使用了512块H800显卡,总租赁成本为53.74万美元。作为业内领先的技术突破,M1的开源或将推动大模型领域的进一步发展。
幻彩逻辑RainbowLogic
06-17 10:22:32
M1
MiniMax
推理模型
分享至
打开微信扫一扫
内容投诉
生成图片
o3-pro答高难题文字游戏引围观,OpenAI前员工讽刺苹果:这都不叫推理那什么叫推理
o3-pro答高难题文字游戏引围观,OpenAI前员工讽刺苹果:这都不叫推理那什么叫推理? 全球首位全职提示工程师Riley Goodside对OpenAI“最新最强版”推理模型o3-pro发起挑战,提问涉及歌手Sabrina Carpenter的一首歌名,要求每个单词最后一个字母连起来也能对应这首...
神经网络领航员
06-13 12:06:17
o3-pro
OpenAI
推理模型
分享至
打开微信扫一扫
内容投诉
生成图片
新“SOTA”推理模型避战Qwen和R1?欧版OpenAI被喷麻了
近日,号称‘欧洲的OpenAI’的Mistral AI发布了其首款推理模型Magistral。该模型支持多语言推理,尤其优化了欧洲语言的推理效果,并提升了可解释性,提供可追溯的思考过程。Magistral通过纯强化学习(RL)训练,采用改进的GRPO算法,在AIME-24数学测试中实现了从26.8%到73.6%的准确率提升。它分为开源的Magistral Small(24B参数)和面向企业的Magistral Medium版本。然而,Magistral未与最新版Qwen和DeepSeek R1对比引发争议,网友自行测试显示Qwen 4B与之接近,而R1表现更优。此外,有声音呼吁Mistral AI应更开源以巩固市场地位。Magistral的发布标志着LLM强化学习训练的新范式,但其透明度仍面临挑战。
Journeyman
06-11 15:12:46
Magistral
Mistral AI
推理模型
分享至
打开微信扫一扫
内容投诉
生成图片
法国 AI 实验室 Mistral 推出推理模型 Magistral 系列,Small 版已开源
6月11日消息,法国AI实验室Mistral推出首个推理模型系列Magistral。该系列包括Magistral Small和Medium两个版本,其中Small版拥有240亿参数并已开源,Medium版处于预览阶段。Magistral旨在提升数学、物理等领域的一致性和可靠性,与OpenAI和谷歌的模型类似。Mistral强调其模型在Le Chat上的答题速度快10倍且支持多语言。尽管Mistral获得超11亿欧元融资,但Magistral在部分基准测试中的表现不及Gemini 2.5 Pro和Claude Opus 4。Mistral成立于2023年,致力于开发AI驱动服务,近期还推出了代码编辑器Mistral Code及企业聊天服务Le Chat Enterprise。
Oasis
06-11 09:04:46
Magistral
Mistral
推理模型
分享至
打开微信扫一扫
内容投诉
生成图片
法国人工智能公司Mistral发布首个推理模型 支持欧洲多种语言
6月10日,法国AI公司Mistral发布首个推理模型,CEO Arthur Mensch称其能与OpenAI、DeepSeek等产品竞争。该模型支持欧洲多语言推理,在数学和编程领域表现出色。当前主流推理模型如OpenAI o1/o3、DeepSeek R1等,在不同复杂度任务中的表现各有优劣,尤其在高复杂度任务中易失效或准确率骤降。Mistral由前谷歌DeepMind、Meta研究人员创立,成立仅两年已获巨额融资并推出多个开源AI模型及类似ChatGPT的聊天机器人Le Chat。Mistral的Magistral模型主打欧洲语言支持,未来计划扩展至更多语种。此前,中国DeepSeek发布的R1模型以低成本高性能引起行业关注。
Journeyman
06-10 20:54:31
Mistral
推理模型
欧洲语言
分享至
打开微信扫一扫
内容投诉
生成图片
Mistral 将推出其首个推理模型 Magistral,与 OpenAI 和 DeepSeek 展开竞争
6月10日,法国AI初创公司Mistral CEO Arthur Mensch宣布将推出首个推理模型Magistral,与OpenAI及DeepSeek竞争。Magistral可进行欧洲多语言逻辑推理,弥补美国模型仅限英语、中国模型仅限中文的不足。Mensch表示,该模型在数学与编码方面表现出色,整体竞争力对标OpenAI o1和DeepSeek R1。今年3月,Mistral已推出Mistral Small 3.1模型,参数达240亿,上下文长度128K,支持本地运行且性能优于OpenAI GPT-4o mini;5月又发布了Medium 3模型,性能接近Claude Sonnet 3.7,但成本更低,每百万Token输入/输出分别为0.4美元/2美元。
数据炼金师
06-10 18:53:38
Magistral
Mistral
推理模型
分享至
打开微信扫一扫
内容投诉
生成图片
LLM神话破灭?苹果论文最新实锤:难以实现真正智能
标题:LLM神话破灭?苹果论文最新实锤:难以实现真正智能 在苹果年度全球开发者大会(WWDC)前夕,苹果因AI功能进展缓慢而陷入被动局面。前首席设计师Jony Ive转向OpenAI合作,外界对苹果能否引领新一轮科技发展持怀疑态度。在此背景下,苹果研究团队发表一项新研究,被专家解读为对大语言模型...
数据炼金师
06-09 20:34:34
ai
LLMs
推理模型
分享至
打开微信扫一扫
内容投诉
生成图片
闫俊杰不甘心
国内AI四小强之一MiniMax的推理模型即将上线。MiniMax创始人闫俊杰此前专注于MoE混合专家模型,推动了国内大模型技术方向的转变。然而,面对DeepSeek等竞争对手,MiniMax在推理模型上落后。MiniMax计划推出的推理模型具备文本理解能力,未来可能扩展至多模态推理,但具体发布时间推迟至6月中旬。MiniMax估值已超40亿美元,但缺乏推理模型影响其后续融资及市场竞争力。此外,MiniMax在应用侧的多元化布局分散了研发资源,导致部分目标未达成。面对DeepSeek R2、GPT-5等强劲对手,MiniMax需尽快通过新模型证明自身技术实力,延续在AI领域的领先地位。
代码编织者Nexus
06-09 17:31:16
MiniMax
推理模型
闫俊杰
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序