M1 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

上海AI公司开源模型登上全球第二

6月17日，上海AI公司MiniMax发布全球首个开源大规模混合架构推理模型MiniMax-M1，在权威评测榜单位列全球开源模型第二。M1支持100万token上下文输入，输出长度达8万token，性能和性价比均表现突出。此后4个工作日，MiniMax接连推出视频生成模型Hailuo 02、智能体产品及音色设计工具。Hailuo 02在物理世界规律理解方面表现出色，生成的“猫跳水”视频动作逻辑清晰，已在Instagram获3亿流量。MiniMax坚持基座模型研发，采用MoE架构、线性注意力机制及CISPO强化学习方法，实现高效能低成本突破。作为大模型‘上海队’一员，MiniMax与商汤、阶跃星辰等共同推动AI产业发展。

原文链接

DreamCoder

07-03 07:50:43

Hailuo 02

MiniMax-M1

MoE架构

分享至

打开微信扫一扫

内容投诉

生成图片

MiniMax发布全球首个混合架构开源模型M1 称强化训练成本仅53万美金

6月17日凌晨，上海AI独角兽MiniMax发布全球首个开源大规模混合架构推理模型M1。M1支持100万Token上下文窗口，推理输出可达8万Token，且强化训练成本仅53万美金，远低于行业平均水平。该模型定价分三个档位，前两档低于DeepSeek-R1，128k-1M Token档为行业空白。MiniMax称M1所需算力仅为DeepSeek R1的25%-30%，其新算法CISPO使强化学习阶段仅用512块H800 GPU，三周完成训练。此举标志着MiniMax加入大模型竞争，同时开启“开源周”，未来四天将发布更多技术更新。目前，DeepSeek R2的发布时间仍未确定，对行业格局带来不确定性。

原文链接

蝶舞CyberSwirl

06-17 19:29:56

MiniMax-M1

开源模型

强化训练成本

分享至

打开微信扫一扫

内容投诉

生成图片

MiniMax 推出全球首个开源大规模混合架构的推理模型 M1：456B 参数，性能超 DeepSeek-R1

6月17日，MiniMax稀宇科技宣布推出全球首个开源大规模混合架构推理模型M1，参数量达456B，性能超越DeepSeek-R1。该模型具备100万上下文输入和8万Token推理输出能力，支持长上下文理解和深度推理。MiniMax表示，M1在复杂生产力场景中表现优异，接近海外顶尖模型且性价比最高。训练采用创新技术，仅用3周、512块H800 GPU完成，租赁成本53.47万美元，远低于预期。M1在多个评测集中表现出色，尤其在长上下文任务中排名全球第二。此外，MiniMax承诺提供免费使用及低成本API服务，后续还将发布更多更新。

原文链接

星际Code流浪者

06-17 17:28:14

MiniMax-M1

开源

推理模型

分享至

打开微信扫一扫

内容投诉

生成图片

MiniMax开源首个推理模型M1

6月17日，人工智能公司Minimax宣布开源其首个推理模型M1。该模型采用了创新的Lightning Attention机制和混合注意力架构，能够支持高达100万token的上下文输入以及最多8万token的输出。性能上，M1在进行8万Token深度推理时仅需DeepSeek R1约30%的算力。据透露，模型强化学习阶段仅耗时三周，使用了512块H800显卡，总租赁成本为53.74万美元。作为业内领先的技术突破，M1的开源或将推动大模型领域的进一步发展。

原文链接

幻彩逻辑RainbowLogic

06-17 10:22:32

MiniMax

推理模型

分享至

打开微信扫一扫

内容投诉

生成图片

基于百川大模型我国首个AI儿科医生上岗

2月14日，国家儿童医学中心首都医科大学附属儿童医院开展了国内首次‘AI儿科医生+多学科专家’的双医并行多学科会诊。此次会诊中，AI儿科医生与多位专家共同参与，通过对患儿病情的详细分析，初步判断颅底肿物可能是皮样囊肿或肿瘤，需进一步通过磁共振检查明确性质。AI儿科医生提出的诊疗建议与专家团队高度一致，展示了其强大的辅助诊断能力。这款AI儿科医生基于百川智能的Baichuan M1大模型，整合了300多位儿科专家的经验和大量病历数据，能提供跨学科、跨病种的复杂临床问题的最新研究成果与诊疗指南，提升临床决策效率。

原文链接

AI创意引擎

02-14 19:44:11

AI儿科医生

Baichuan M1大模型

百川智能

分享至

打开微信扫一扫

内容投诉

生成图片

百川智能发布深度思考模型 Baichuan-M1-preview，同时具备语言、视觉和搜索三大领域推理能力

百川智能于1月24日发布全场景深度思考模型Baichuan-M1-preview，具备语言、视觉和搜索三大领域推理能力。该模型在数学、代码等多项权威评测中表现优异，可对标o1-preview。此外，百川智能还推出了行业首个开源医疗增强大模型Baichuan-M1-14B，医疗能力超越更大参数量的Qwen2.5-72B，与o1-mini相当。Baichuan-M1-14B支持医疗循证模式，能快速精准回答医疗临床及科研问题。相关资源已在GitHub和Huggingface上开源。

原文链接

WisdomTrail

01-24 14:43:00

Baichuan-M1-preview

医疗增强大模型

深度推理

分享至

打开微信扫一扫

内容投诉

生成图片

全场景深度思考模型发布：囊括三大推理能力，解锁医疗循证模式

1月24日，百川智能发布了国内首个全场景深度思考模型Baichuan-M1-preview。该模型具备语言、视觉和搜索三大领域推理能力，表现超越o1-preview。作为国内唯一专注医疗领域的头部大模型公司，百川智能推出的Baichuan-M1-preview解锁了医疗循证模式，实现从证据检索到深度...

原文链接

跨界思维

01-24 13:40:22

Baichuan-M1-preview

医疗循证模式

深度思考模型

分享至

打开微信扫一扫

内容投诉

生成图片

苹果推出300亿参数多模态AI大模型MM1.5：拥有图像识别、自然语言推理能力

【苹果推出300亿参数多模态AI大模型MM1.5】苹果公司在10月13日发布了一款名为MM1.5的多模态AI大模型，该模型拥有300亿参数，是基于前代MM1架构发展而来。MM1.5在数据驱动的训练原则下，着重研究不同训练周期中混合数据对模型性能的影响，并在Hugging Face平台上发布了相关模型...

原文链接

AGI探路者

10-15 17:19:08

300亿参数多模态AI大模型MM1.5

图像识别和自然语言推理能力

苹果

分享至

打开微信扫一扫

内容投诉

生成图片

前OpenAI创始成员Andrej Karpathy创办了一家AI教育公司，让AI当80亿人的老师 | 最前线

安德烈·卡帕西，前OpenAI和特斯拉AI主管，创立了Eureka Labs，一个AI教育平台，目标是利用生成式AI技术，打造教学助理，协助教师设计课程并辅导学生。他们的首款产品是本科水平的AI课程LLM101n，旨在让学生自主训练AI。卡帕西希望通过AI普及高质量教育资源，扩大教育覆盖和深度。课程内容丰富，包括AI基础和先进技术，如语言建模和深度学习。公司强调内容免费，收入来源于组织学习小组等非内容收费方式。卡帕西本人对教育充满热情，他的教育背景和YouTube教学视频显示了他对这一事业的长期承诺。Eureka Labs是他将AI和教育结合的全职追求。

原文链接

新智燎原

07-17 16:56:59

AI教育

Eureka Labs

LLM101n

分享至

打开微信扫一扫

内容投诉

生成图片

AI 大神 Karpathy 官宣创业：打造 80 亿人 AI 原生学校，首款课程 GitHub 斩获 17k 星

今日，AI界巨星Karpathy正式宣布创立Eureka Labs，致力于打造全球80亿人AI原生学校。这位前OpenAI员工离职后专注教育，首款课程LLM101n在GitHub收获17k星好评。课程从基础语言模型至深度学习全面覆盖，适合初学者，目标是通过AI教学助手提升教育体验。Karpathy借鉴费曼理念，强调实践与理解。课程设计旨在使教育更公平且深度可扩展。Eureka Labs的首个课程将以免费内容为主，收入来源于组织学习活动等，创始人希望教育内容开放可达。众多AI大佬纷纷祝贺，期待Eureka Labs在教育领域的创新。

原文链接