1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
没有商业模式,是DeepSeek最坚固的「护城河」
1月27日将迎来‘DeepSeek时刻’一周年,全球AI社区期待其新动作。科技评论人Kevin Xu分析指出,DeepSeek最坚固的护城河是零外部融资、无商业化压力的模式。创始人梁文锋依靠量化基金‘幻方量化’的巨额利润支撑研发,完全掌控研发方向。相比之下,其他AI实验室因资本裹挟面临资源内耗和商业化压力。尽管DeepSeek未开源数据集,不再是市场最开放玩家,但其纯粹专注AGI研究的特质备受认可。Kevin认为,一旦接受外部投资,DeepSeek的独特性将消失,而这正是其长期优势所在。
新智燎原
01-21 14:10:41
AGI
DeepSeek
商业模式
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek更新GitHub仓库 新模型“MODEL1”曝光
1月21日,DeepSeek在GitHub更新deepseek-ai/FlashMLA仓库,新增一个未公开模型架构标识“MODEL1”,被提及31次。MODEL1是DeepSeek FlashMLA支持的两大核心模型之一,另一为DeepSeek-V3.2。推测MODEL1为高效推理模型,内存占用低于V3.2,适合边缘设备或成本敏感场景,也可能针对16K+长序列优化,适用于文档理解、代码分析等任务。此次更新涉及114个代码文件,涵盖多种格式。(腾讯科技)
灵感Phoenix
01-21 11:03:39
DeepSeek
FlashMLA
MODEL1
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek 新模型曝光:MODEL1 代码预示新架构,最快有望 2 月发布
1月21日消息,DeepSeek计划于2月农历新年期间发布新一代旗舰AI模型DeepSeek V4,预计将具备更强的代码编写能力。1月20日,开发者发现DeepSeek在GitHub更新的代码中多次提到未知标识符“MODEL1”,可能代表全新架构。与现有模型“V32”相比,“MODEL1”在键值缓存布局、稀疏性处理及FP8解码支持等方面存在显著差异,表明新架构或优化内存与计算效率。此外,DeepSeek近期发布的两篇论文介绍“优化残差连接(mHC)”和“AI记忆模块(Engram)”,可能整合到新模型中。此前爆料称,DeepSeek V4的编程能力有望超越OpenAI GPT及Anthropic Claude。
蝶舞CyberSwirl
01-21 09:02:53
DeepSeek
MODEL1
新架构
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明
正文:2026年1月,谷歌研究发现DeepSeek-R1等顶尖推理模型在解题时会‘分裂’出多重虚拟人格,如外向型、严谨型等,通过内部对话与辩论提升推理能力。研究团队借助稀疏自编码器(SAE)解码AI的‘脑内群聊’,揭示其推理过程类似人类左右脑互搏。实验表明,强化对话特征可显著提高模型准确率,例如Countdown算术任务中从27.1%提升至54.8%。此外,多智能体对话数据微调使Qwen-2.5-3B和Llama-3.2-3B模型训练效率远超传统方法,呼应了‘社会脑假说’。
未来笔触
01-20 13:05:54
DeepSeek
多重人格
左右脑互搏
分享至
打开微信扫一扫
内容投诉
生成图片
不是接入DeepSeek,就叫AI制药
2026年1月,AI制药在二级市场引发炒作热潮,但多数公司缺乏实质技术支撑。真正的AI制药公司需具备同行评审的AI模型、专业团队及高价值BD交易,而当前疯涨的企业多无原创模型或研发成果。行业经历2020-2021年资本热潮后进入融资寒冬,部分中国企业通过十年努力崭露头角,与单纯接入DeepSeek蹭概念的公司形成鲜明对比。医药基金关注靶点和临床数据,科技基金则倾向更高确定性的领域,导致AI制药在二级市场投资逻辑受限。若看好该领域,应聚焦挖掘真正龙头,而非依赖赛道思维躺赚。
新智燎原
01-17 16:35:32
AI制药
DeepSeek
二级市场
分享至
打开微信扫一扫
内容投诉
生成图片
出圈一周年,DeepSeek的变与不变
2026年1月16日,DeepSeek即将迎来出圈一周年。这家由幻方量化孵化的AI企业,凭借2025年初发布的DeepSeek-R1模型成为全球焦点,下载量超越ChatGPT。其低成本高成效策略推动开源大模型发展,V3.2版本已能对标GPT-5。尽管估值高达1.05万亿元,位居全球第四大独角兽,但DeepSeek面临激烈竞争:阿里巴巴、百度等互联网巨头纷纷加码开源模型,新兴玩家如九坤投资也瞄准其生态位。此外,场景之争中,DeepSeek月活用户较巅峰期下降约四分之一,落后于豆包等竞品。创始人梁文锋表示,DeepSeek将专注基础模型创新,错位竞争。外界对其2026年2月计划发布的V4模型充满期待,但AI竞赛更考验耐力与长远布局。
LunarCoder
01-16 15:50:22
AI应用
DeepSeek
开源模型
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek大量招人,该梁文锋上场了
2026年初,DeepSeek在技术领域动作频频,接连发布两篇重磅论文并开源新模块Engram代码。1月1日发布的《mHC》解决了超大规模模型训练稳定性问题,而最新模块Engram则通过外挂式记忆提升大模型知识调取效率。两项研究均以梁文锋为核心作者,显示团队正为下一代模型V4积累关键技术。与此同时,DeepSeek开启大规模招聘,涵盖深度学习研究员、全栈工程师等核心岗位,工作地点包括北京和杭州。行业分析认为,DeepSeek V4或将结合MoE计算效率、Engram低成本记忆及mHC稳定性,成为一款架构精巧的‘缝合怪’,进一步巩固其行业地位。春节将至,DeepSeek的技术布局或预示V4即将发布。
QuantumHacker
01-16 15:41:13
DeepSeek
Engram
梁文锋
分享至
打开微信扫一扫
内容投诉
生成图片
摩根资产管理:中国科技领域将迎来“更多DeepSeek时刻”
1月14日,摩根资产管理表示,中国科技股将因技术突破持续受益,特别是在创建类似DeepSeek的公司方面。全球市场策略师Raisah Rasid指出,中国科技领域将迎来更多机器人技术进步和‘DeepSeek时刻’。年初至今,中国内地科技股指数上涨12%,跑赢美国同类指数,投资者热情高涨。展望未来,Rasid认为人工智能支出增长及政策支持将成为推动中国科技股的关键因素。
量子思考者
01-14 16:47:01
DeepSeek时刻
中国科技
人工智能支出
分享至
打开微信扫一扫
内容投诉
生成图片
微软研报称 DeepSeek 在中国 AI 市场份额达 89%,在白俄罗斯达 56%
1月13日,微软总裁布拉德·史密斯表示,中国正通过‘低成本开源模型+政府高额补贴’在西方以外的国际市场赢得AI竞赛。微软研究显示,DeepSeek发布的R1大语言模型因易用性和低成本,在全球南方国家加速AI普及。其中,DeepSeek在中国市场份额达89%,白俄罗斯56%,古巴49%,俄罗斯43%。史密斯警告,AI普及集中在发达国家,全球北方国家近四分之一人口使用AI,而南方仅为14%,可能加剧经济差距。他呼吁国际机构投资非洲数据中心和电力补贴,以应对中国企业的竞争优势。
LunarCoder
01-13 16:44:20
AI 市场份额
DeepSeek
全球南方
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek母公司去年进账50亿,够烧2380个R1
2026年初,DeepSeek母公司幻方量化公布去年收益达50亿人民币,收益率56.6%,位居全国百亿级量化基金第二。这一巨额收入为DeepSeek的AGI研究提供了充足资金支持,按现有研发成本计算,足够训练125个V3或2380个R1模型。与多数大模型公司不同,DeepSeek未进行外部融资,专注AGI研究,持续开源高水平成果如R1和记忆模块,并吸引顶尖人才稳定留任。此外,DeepSeek的技术论文间接推动国产芯片公司股价上涨,如寒武纪在V3.2发布后股价涨近5%。背靠幻方量化的财务支持,DeepSeek无需商业化压力,继续深耕底层技术,未来或推出R2/V4模型。
跨界思维
01-13 16:43:30
AGI
DeepSeek
幻方量化
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序