1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
上海AI公司开源模型登上全球第二
6月17日,上海AI公司MiniMax发布全球首个开源大规模混合架构推理模型MiniMax-M1,在权威评测榜单位列全球开源模型第二。M1支持100万token上下文输入,输出长度达8万token,性能和性价比均表现突出。此后4个工作日,MiniMax接连推出视频生成模型Hailuo 02、智能体产品及音色设计工具。Hailuo 02在物理世界规律理解方面表现出色,生成的“猫跳水”视频动作逻辑清晰,已在Instagram获3亿流量。MiniMax坚持基座模型研发,采用MoE架构、线性注意力机制及CISPO强化学习方法,实现高效能低成本突破。作为大模型‘上海队’一员,MiniMax与商汤、阶跃星辰等共同推动AI产业发展。
DreamCoder
07-03 07:50:43
Hailuo 02
MiniMax-M1
MoE架构
分享至
打开微信扫一扫
内容投诉
生成图片
MiniMax发布全球首个混合架构开源模型M1 称强化训练成本仅53万美金
6月17日凌晨,上海AI独角兽MiniMax发布全球首个开源大规模混合架构推理模型M1。M1支持100万Token上下文窗口,推理输出可达8万Token,且强化训练成本仅53万美金,远低于行业平均水平。该模型定价分三个档位,前两档低于DeepSeek-R1,128k-1M Token档为行业空白。MiniMax称M1所需算力仅为DeepSeek R1的25%-30%,其新算法CISPO使强化学习阶段仅用512块H800 GPU,三周完成训练。此举标志着MiniMax加入大模型竞争,同时开启“开源周”,未来四天将发布更多技术更新。目前,DeepSeek R2的发布时间仍未确定,对行业格局带来不确定性。
蝶舞CyberSwirl
06-17 19:29:56
MiniMax-M1
开源模型
强化训练成本
分享至
打开微信扫一扫
内容投诉
生成图片
MiniMax 推出全球首个开源大规模混合架构的推理模型 M1:456B 参数,性能超 DeepSeek-R1
6月17日,MiniMax稀宇科技宣布推出全球首个开源大规模混合架构推理模型M1,参数量达456B,性能超越DeepSeek-R1。该模型具备100万上下文输入和8万Token推理输出能力,支持长上下文理解和深度推理。MiniMax表示,M1在复杂生产力场景中表现优异,接近海外顶尖模型且性价比最高。训练采用创新技术,仅用3周、512块H800 GPU完成,租赁成本53.47万美元,远低于预期。M1在多个评测集中表现出色,尤其在长上下文任务中排名全球第二。此外,MiniMax承诺提供免费使用及低成本API服务,后续还将发布更多更新。
星际Code流浪者
06-17 17:28:14
MiniMax-M1
开源
推理模型
分享至
打开微信扫一扫
内容投诉
生成图片
MiniMax开源首个推理模型M1
6月17日,人工智能公司Minimax宣布开源其首个推理模型M1。该模型采用了创新的Lightning Attention机制和混合注意力架构,能够支持高达100万token的上下文输入以及最多8万token的输出。性能上,M1在进行8万Token深度推理时仅需DeepSeek R1约30%的算力。据透露,模型强化学习阶段仅耗时三周,使用了512块H800显卡,总租赁成本为53.74万美元。作为业内领先的技术突破,M1的开源或将推动大模型领域的进一步发展。
幻彩逻辑RainbowLogic
06-17 10:22:32
M1
MiniMax
推理模型
分享至
打开微信扫一扫
内容投诉
生成图片
基于百川大模型 我国首个AI儿科医生上岗
2月14日,国家儿童医学中心首都医科大学附属儿童医院开展了国内首次‘AI儿科医生+多学科专家’的双医并行多学科会诊。此次会诊中,AI儿科医生与多位专家共同参与,通过对患儿病情的详细分析,初步判断颅底肿物可能是皮样囊肿或肿瘤,需进一步通过磁共振检查明确性质。AI儿科医生提出的诊疗建议与专家团队高度一致,展示了其强大的辅助诊断能力。这款AI儿科医生基于百川智能的Baichuan M1大模型,整合了300多位儿科专家的经验和大量病历数据,能提供跨学科、跨病种的复杂临床问题的最新研究成果与诊疗指南,提升临床决策效率。
AI创意引擎
02-14 19:44:11
AI儿科医生
Baichuan M1大模型
百川智能
分享至
打开微信扫一扫
内容投诉
生成图片
百川智能发布深度思考模型 Baichuan-M1-preview,同时具备语言、视觉和搜索三大领域推理能力
百川智能于1月24日发布全场景深度思考模型Baichuan-M1-preview,具备语言、视觉和搜索三大领域推理能力。该模型在数学、代码等多项权威评测中表现优异,可对标o1-preview。此外,百川智能还推出了行业首个开源医疗增强大模型Baichuan-M1-14B,医疗能力超越更大参数量的Qwen2.5-72B,与o1-mini相当。Baichuan-M1-14B支持医疗循证模式,能快速精准回答医疗临床及科研问题。相关资源已在GitHub和Huggingface上开源。
WisdomTrail
01-24 14:43:00
Baichuan-M1-preview
医疗增强大模型
深度推理
分享至
打开微信扫一扫
内容投诉
生成图片
全场景深度思考模型发布:囊括三大推理能力,解锁医疗循证模式
1月24日,百川智能发布了国内首个全场景深度思考模型Baichuan-M1-preview。该模型具备语言、视觉和搜索三大领域推理能力,表现超越o1-preview。作为国内唯一专注医疗领域的头部大模型公司,百川智能推出的Baichuan-M1-preview解锁了医疗循证模式,实现从证据检索到深度...
跨界思维
01-24 13:40:22
Baichuan-M1-preview
医疗循证模式
深度思考模型
分享至
打开微信扫一扫
内容投诉
生成图片
苹果推出300亿参数多模态AI大模型MM1.5:拥有图像识别、自然语言推理能力
【苹果推出300亿参数多模态AI大模型MM1.5】苹果公司在10月13日发布了一款名为MM1.5的多模态AI大模型,该模型拥有300亿参数,是基于前代MM1架构发展而来。MM1.5在数据驱动的训练原则下,着重研究不同训练周期中混合数据对模型性能的影响,并在Hugging Face平台上发布了相关模型...
AGI探路者
10-15 17:19:08
300亿参数多模态AI大模型MM1.5
图像识别和自然语言推理能力
苹果
分享至
打开微信扫一扫
内容投诉
生成图片
前OpenAI创始成员Andrej Karpathy创办了一家AI教育公司,让AI当80亿人的老师 | 最前线
安德烈·卡帕西,前OpenAI和特斯拉AI主管,创立了Eureka Labs,一个AI教育平台,目标是利用生成式AI技术,打造教学助理,协助教师设计课程并辅导学生。他们的首款产品是本科水平的AI课程LLM101n,旨在让学生自主训练AI。卡帕西希望通过AI普及高质量教育资源,扩大教育覆盖和深度。课程内容丰富,包括AI基础和先进技术,如语言建模和深度学习。公司强调内容免费,收入来源于组织学习小组等非内容收费方式。卡帕西本人对教育充满热情,他的教育背景和YouTube教学视频显示了他对这一事业的长期承诺。Eureka Labs是他将AI和教育结合的全职追求。
新智燎原
07-17 16:56:59
AI教育
Eureka Labs
LLM101n
分享至
打开微信扫一扫
内容投诉
生成图片
AI 大神 Karpathy 官宣创业:打造 80 亿人 AI 原生学校,首款课程 GitHub 斩获 17k 星
今日,AI界巨星Karpathy正式宣布创立Eureka Labs,致力于打造全球80亿人AI原生学校。这位前OpenAI员工离职后专注教育,首款课程LLM101n在GitHub收获17k星好评。课程从基础语言模型至深度学习全面覆盖,适合初学者,目标是通过AI教学助手提升教育体验。Karpathy借鉴费曼理念,强调实践与理解。课程设计旨在使教育更公平且深度可扩展。Eureka Labs的首个课程将以免费内容为主,收入来源于组织学习活动等,创始人希望教育内容开放可达。众多AI大佬纷纷祝贺,期待Eureka Labs在教育领域的创新。
AI创想团
07-17 15:05:31
ai
Eureka Labs
LLM101n
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序