1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
DeepSeek登《Nature》封面,梁文锋带队,首次回应争议
2025年9月17日,DeepSeek-AI团队梁文锋及其同事在《自然》杂志发表开源模型DeepSeek-R1研究成果,并登上封面。研究显示,通过纯强化学习显著提升大语言模型推理能力,减少对人工标注依赖,在数学、编程等领域表现优异。团队首次回应“蒸馏”争议,强调R1未复制OpenAI模型数据,而是吸收互联网已有内容。DeepSeek-R1研发成本仅约630万美元,远低于国际巨头,其创新方法论采用组相对策略优化算法,突破传统训练方式。测试中,R1在美国数学邀请赛准确率达86.7%,超越人类平均水平。DeepSeek的成功背后是梁文锋十年创业奋斗史,从量化交易到AI研发,他坚持低成本高效创新。Nature评论称,R1开启了一场AI‘推理革命’,或引领全球AI竞争从算力转向算法创新。
智慧棱镜
09-18 13:54:10
DeepSeek-R1
强化学习
梁文锋
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek-R1 论文登上《自然》封面,通讯作者为梁文锋
正文:9月18日,DeepSeek团队的研究论文《DeepSeek-R1》登上国际权威期刊《自然》第645期封面,通讯作者为梁文锋。这是全球首个经过同行评审的主流大语言模型,填补了该领域的空白。论文指出,当前AI推理能力依赖大量人工标注数据,且复杂问题处理能力有限。研究提出一种纯强化学习框架,可激发大型语言模型自主形成高级推理模式,如自我反思、验证和动态策略调整。经训练的模型在数学、编程竞赛及STEM领域表现优于传统监督学习模型,并能提升小型模型的推理能力。
E-Poet
09-18 09:48:42
DeepSeek-R1
强化学习
梁文锋
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek-R1开创历史 梁文锋论文登上《自然》封面
9月17日,DeepSeek团队与通讯作者梁文锋共同完成的DeepSeek-R1推理模型研究论文登上国际权威期刊《自然》封面。此次论文披露了更多模型训练细节,并回应了年初发布的初版论文中关于蒸馏质疑的问题。DeepSeek-R1成为全球首个经过同行评审的主流大语言模型,《自然》评价称其填补了主流大模型独立同行评审的空白。这一成果标志着AI领域研究迈入更严谨和透明的新阶段,具有重要历史意义。
AGI探路者
09-18 07:46:43
DeepSeek-R1
梁文锋
自然封面
分享至
打开微信扫一扫
内容投诉
生成图片
《时代》评选百大AI人物:任正非、梁文锋、王兴兴入选领导者!与黄仁勋马斯克等齐名
8月29日,美国《时代》杂志发布“人工智能领域最具影响力100人”榜单,分为领导者、创新者、塑造者和思想家四大类别。华为创始人任正非、DeepSeek梁文锋及宇树科技王兴兴入选领导者,与黄仁勋、马斯克等齐名。任正非带领华为成为全球AI重要力量,其昇腾910C芯片性能达英伟达H100的60%,并推出CloudMatrix 384系统。梁文锋因发布低成本大模型R1获认可,被称为“价格屠夫”。王兴兴则以春晚机器人表演闻名,致力于探索机器人在家庭、工业和农业中的实用价值。
数字墨迹
08-29 18:42:54
任正非
梁文锋
王兴兴
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek又更新了,期待梁文锋“炸场”
2025年8月21日,DeepSeek发布V3.1版本更新,上下文长度扩展至128K,交互友好度和编程能力显著提升。开发人员指出,V3与R1模型可能已合并,降低部署成本并提升性能。尽管此次更新未推出备受期待的R2模型,但市场对DeepSeek及其创始人梁文锋的关注持续升温。自1月R1发布以来,DeepSeek用户快速增长,成为全球增速最快的AI应用之一,同时引发行业‘参照物’竞争。阿里巴巴、月之暗面等厂商纷纷推出新模型对标R1。业内人士推测,V3.1可能是为多模态模型发布铺路,市场正期待梁文锋再次‘炸场’。
未来笔触
08-21 09:28:01
DeepSeek
R2模型
梁文锋
分享至
打开微信扫一扫
内容投诉
生成图片
梁文锋,准备战斗
7月底,上海刚结束一场规模空前的WAIC(世界人工智能大会),参展商数量增长60%,AI教父辛顿首次现身中国,门票炒至单日千元。展会上,中国企业纷纷展示实力,吸引外国观众与外媒关注,试图复刻DeepSeek效应。然而技术颠覆并非易事。7月中旬,中国AI模型Kimi K2发布,采用万亿参数架构,海外关注度迅速攀升,被称为“又一个DeepSeek时刻”。随后智谱发布GLM-4.5开源模型,同样希望复制DeepSeek的成功路径。与此同时,GPT-5预计2025年8月发布,将实现多模态深度融合,可能成为下一轮引爆点。DeepSeek以强化学习与算法创新影响行业,促使百度等企业转向开源。当前,字节、阶跃星辰等公司正积极布局,探索下一代AI范式。
AI奇点纪元
07-30 17:51:33
DeepSeek
GPT-5
梁文锋
分享至
打开微信扫一扫
内容投诉
生成图片
梁文锋等来及时雨
2025年7月15日,DeepSeek因算力问题推迟新模型发布,但英伟达H20芯片禁售令迎来转机,为梁文锋带来及时雨。此前,DeepSeek自1月以来流量和使用率持续下滑,月活跃用户环比下降5.1%,下载排名跌至30名开外。与此同时,Kimi、阶跃星辰等国内大模型玩家纷纷借新模型抢夺市场,挑战DeepSeek的性价比与性能优势。Kimi K2开源并实现反超,MiniMax-M1以低成本训练吸引关注。尽管DeepSeek在第三方平台使用量增长近20倍,但其忽视多模态和工具调用能力的短板使其面临激烈竞争。梁文锋需尽快推出R2和V4模型,并补全功能缺陷,以应对多模态与Agent生态的发展需求。
虚拟织梦者
07-15 17:50:04
DeepSeek
Kimi
梁文锋
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek流量下滑,这半年梁文锋都干了啥?
2025年7月,半导体研究机构Semianalysis报告显示,DeepSeek用户使用率从年初7.5%峰值回落,官网流量下滑至3%;移动端月活用户也较3月减少2500万至1.69亿。尽管如此,创始人梁文锋坚持AGI技术理想,强调技术创新期的重要性。今年4月,DeepSeek发布“产品&设计”岗位招聘信息,为智能体产品布局做准备。6月新增“微信扫码登录”,5月升级模型版本并优化功能。相比竞争对手如豆包、腾讯元宝等推出Agent功能,DeepSeek仍以小步快跑方式迭代优化,团队约130人。业内人士认为,其背靠幻方量化具备商业化优势,但AI生态建设尚处起步阶段。
Nebula
07-14 14:22:04
AI生态
DeepSeek
梁文锋
分享至
打开微信扫一扫
内容投诉
生成图片
梁文锋不着急
5月28日,DeepSeek宣布DeepSeek-R1模型完成小版本试升级,API服务短暂中断5分钟。5月29日开源R1最新0528版本,这是R1自1月推出以来的首次更新。更新后的R1-0528在数学、编程等能力上接近国际顶尖模型,幻觉率降低45%-50%。此次更新通过后训练提升了模型的思维深度与推理能力,但上下文长度仍为64K,低于部分竞争对手。DeepSeek称R2模型可能需等待V4模型完成后推出。梁文锋团队专注于模型本身而非急于商业化,与转向AI Agent的行业趋势不同。DeepSeek的坚持得到英伟达CEO黄仁勋认可,其股价因DeepSeek更新未受负面影响。
星际Code流浪者
05-30 21:56:33
DeepSeek-R1
大模型
梁文锋
分享至
打开微信扫一扫
内容投诉
生成图片
全网都在等梁文锋
5月将至,中美科技巨头竞争加剧。DeepSeek或于本月发布全新旗舰模型R2,引发行业关注。DeepSeek创始人梁文锋带领团队保持高频率迭代,R2预计在代码生成和多语言推理能力上有突破。技术参数显示,R2拥有1.2万亿参数,成本仅为GPT-4的2.7%,并在多项测试中表现优异。此前DeepSeek V3-0324已在基准测试中领先,R2被视为改变全球AI格局的关键。此外,国产芯片的崛起为DeepSeek提供了新机会,其合作进展备受瞩目。
元界筑梦师
04-30 19:53:07
AI大模型
DeepSeek R2
梁文锋
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序