1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
AI 的下一个战场:小模型崛起
AI 的下一个战场:小模型崛起 大模型热潮正逐渐降温,小模型开始崭露头角。八月初,腾讯推出“混元系列小模型”,阿里随后发布两款通义Qwen3-4B,OpenAI更开源了gpt-oss-20B等小模型。头部玩家的集体转向表明,端侧小模型正重回舞台中央。 小模型并非新概念,但这次回归的是真正落地...
代码编织者
09-05 21:26:34
小模型
端侧智能
面壁智能
分享至
打开微信扫一扫
内容投诉
生成图片
一天吃透一条产业链:端侧 AI
2025年9月,端侧AI成为人工智能领域重要方向,通过将AI能力嵌入手机、电脑等设备,实现本地化运算,提升速度、节省流量并增强数据安全。上游产业链核心硬件包括AI芯片、SoC、存储芯片和智能传感芯片,全球市场预计快速增长,如SoC市场规模将在未来十年达3278亿美元。中游市场显示,2023年全球消费设备达228亿台,中国端侧AI市场年均增速58%,预计2028年突破1.9万亿元。生成式AI正快速应用于终端设备,推动软硬件升级。下游应用涵盖智能汽车和机器人,端侧AI让汽车实现零延迟交互,机器人则迈向具身智能时代。投资者可关注相关ETF产品捕捉产业成长机会。
代码编织者Nexus
09-03 10:45:44
AI芯片
智能模组
端侧AI
分享至
打开微信扫一扫
内容投诉
生成图片
国内芯片厂商,业绩大洗牌
2025年上半年,全球半导体市场规模达3460亿美元,同比增长18.9%,国内芯片厂商表现亮眼。算力领域,寒武纪营收增长超43倍,净利润达10.38亿元;海光信息与澜起科技业绩均显著提升。端侧AI芯片企业如瑞芯微、恒玄科技等也实现营收和利润双增。功率半导体领域,士兰微、扬杰科技等企业逆势增长,净利润大幅提升。然而,存储芯片行业虽营收增长,但多数企业因价格波动和库存压力净利润承压。展望下半年,AI需求驱动行业布局,政策支持进一步推动“AI+”行动,中国芯片产业正迈向自主可控与高景气发展新阶段。
蝶舞CyberSwirl
08-29 19:42:57
国内芯片厂商
端侧AI芯片
算力公司
分享至
打开微信扫一扫
内容投诉
生成图片
多模态新旗舰MiniCPM-V 4.5:8B 性能超越 72B,高刷视频理解又准又快
2025年8月27日,面壁智能正式开源8B参数的MiniCPM-V 4.5多模态旗舰模型。该模型是行业首个具备“高刷”视频理解能力的多模态模型,在性能与效率上实现越级领先,超越Qwen2.5-VL 72B模型。MiniCPM-V 4.5最大支持6倍视频帧数量输入,达到96倍视觉压缩率,显著提升动态画面理解精度。在图片、长视频、OCR及文档解析等任务中均达SOTA水平,并支持短思考与长思考混合推理模式,适用于端侧设备。模型已开源,可通过GitHub、Hugging Face和ModelScope获取。
电子诗篇
08-27 12:03:30
多模态模型
端侧推理
高刷视频理解
分享至
打开微信扫一扫
内容投诉
生成图片
一年20万台出货,AI 玩具公司Haivivi 刚拿了2亿新融资,我们和创始人聊了聊
2025年8月,AI玩具公司跃然创新(Haivivi)宣布完成2亿元A轮融资,投资方包括中金资本、红杉中国等。该公司过去一年出货量超20万台,成为全球出货最多的AI玩具企业。创始人李勇透露,团队曾因资金问题险些清算,但在第一代产品BubblePal上市后销量爆发,成功扭转局面。BubblePal于2024年6月推出,支持角色扮演、多语言对话等功能,还原了多个经典IP角色。尽管市场质疑硬件壁垒和情绪价值,Haivivi坚持打造有生命感的AI玩具,并即将推出第二代产品CocoMate系列,采用端到端语音模型和可拆卸设计。李勇认为,AI玩具的核心在于提供情绪价值,未来端侧AI技术突破将进一步推动行业发展。
月光编码师
08-25 12:30:28
AI玩具
情绪价值
端侧模型
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌开源 Gemma 家族最轻量模型 Gemma 3 270M:2.7 亿参数可灵活用于 手机平板端侧及 Web 环境
8月16日,谷歌发布开源Gemma系列中最轻量模型Gemma 3 270M,参数规模2.7亿,专为端侧部署设计,支持手机、平板及Web环境。该模型在Q4_0量化格式下仅需约240MB RAM,适合低功耗设备,如Pixel 9 Pro运行25轮对话仅耗电0.75%。其擅长处理高频任务与隐私场景,如情感分析、实体识别等,还可用于开发专用小型模型。谷歌同步提供基于Hugging Face Transformers的微调教学资源,支持分类、信息抽取等定制化开发。目前已有开发者通过transformers.js实现浏览器端运行,验证了其在Web环境中的性能与可控性。
虚拟微光
08-16 16:27:24
Gemma 3 270M
低功耗设备
端侧部署
分享至
打开微信扫一扫
内容投诉
生成图片
韩企 DEEPX 联手三星打造全球首款 2nm 端侧生成式 AI 芯片,2027 年量产
8月13日,韩国边缘AI芯片企业DEEPX宣布与三星晶圆代工及GAONCHIPS合作,共同开发全球首款2nm端侧生成式AI芯片DX-M2。相比上代5nm工艺产品,新芯片采用三星2nm工艺,能效提升一倍。目标是以5W功耗在20B参数模型下实现每秒20~30 Token推理输出,优于高通芯片性能。目前已有DX-M2原型,计划2026年上半年试产,2027年大规模量产。
GhostPilot
08-13 14:35:32
2nm AI芯片
DEEPX
端侧生成式AI
分享至
打开微信扫一扫
内容投诉
生成图片
高通:OpenAI 最小开源模型 gpt-oss-20b 可在骁龙终端运行
8月6日,OpenAI发布其最小开源模型gpt-oss-20b,高通宣布这是首个可在搭载骁龙平台的终端上运行的OpenAI开源推理模型。该模型具有200亿参数,支持复杂思维链推理,无需依赖云端。高通通过AI引擎和Qualcomm AI Stack进行集成测试,证实其性能卓越。这一突破标志着AI助手式推理将更多转向本地化,带来隐私保护与时延优势,同时为云端解决方案提供支持。开发者可通过Hugging Face、Ollama等平台获取模型,并在骁龙终端部署。更多细节将在Qualcomm AI Hub公布。
超频思维站
08-11 22:08:24
gpt-oss-20b
终端侧推理
骁龙平台
分享至
打开微信扫一扫
内容投诉
生成图片
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus
2025年8月6日深夜,Qwen团队发布两款4B端侧模型:Qwen3-4B-Instruct-2507(非推理模型)和Qwen3-4B-Thinking-2507(高级推理模型)。这两款模型支持256k上下文,性能大幅提升。其中,Qwen3-4B-Thinking-2507在AIME25测试中得分81.3,超越Claude 4 Opus和Gemini 2.5 Pro等更大规模模型,尤其在数学、逻辑推理等领域表现突出。新模型对端侧设备友好,甚至可在树莓派上运行,已开源并提供部署建议。此次更新正值OpenAI开源gpt-oss系列同日发布,而GPT-5预计于8月8日凌晨推出,行业竞争激烈。
智慧棱镜
08-07 09:45:09
AIME25
Qwen
端侧模型
分享至
打开微信扫一扫
内容投诉
生成图片
阿里通义千问 Qwen3-4B-2507 双料更新:手机也能轻松跑,AI 体积小、性能强
8月6日,阿里通义千问Qwen推出Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507双模型更新。新版本体积小、性能强,适配手机等端侧硬件。Instruct版提升通用能力,上下文理解扩展至256K,适合内容创作与工具调用;Thinking版强化推理能力,在AIME25测评中获81.3分,媲美中等规模模型。官方称两模型分别定位“执行专家”和“学术专家”,满足不同场景需求。
AI思维矩阵
08-07 07:43:52
Qwen3-4B
端侧部署
通义千问
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序