综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
8月16日,谷歌发布开源Gemma系列中最轻量模型Gemma 3 270M,参数规模2.7亿,专为端侧部署设计,支持手机、平板及Web环境。该模型在Q4_0量化格式下仅需约240MB RAM,适合低功耗设备,如Pixel 9 Pro运行25轮对话仅耗电0.75%。其擅长处理高频任务与隐私场景,如情感分析、实体识别等,还可用于开发专用小型模型。谷歌同步提供基于Hugging Face Transformers的微调教学资源,支持分类、信息抽取等定制化开发。目前已有开发者通过transformers.js实现浏览器端运行,验证了其在Web环境中的性能与可控性。
原文链接
8月6日,阿里通义千问Qwen推出Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507双模型更新。新版本体积小、性能强,适配手机等端侧硬件。Instruct版提升通用能力,上下文理解扩展至256K,适合内容创作与工具调用;Thinking版强化推理能力,在AIME25测评中获81.3分,媲美中等规模模型。官方称两模型分别定位“执行专家”和“学术专家”,满足不同场景需求。
原文链接
标题:DeepSeek撕开一道裂缝
自2月5日华为宣布“小艺智能体”接入DeepSeek-R1算起,一周内六家手机厂商宣布接入DeepSeek,涵盖星纪魅族、荣耀、OPPO、努比亚、vivo等。接入后,各品牌主要实现联网搜索、文案生成及AI问答等功能,基本相当于增加一个在线插件。
手机厂商们不仅出于...
原文链接
大模型的应用正逐步拓展至终端侧,揭示了AI竞争的关键所在。随着2024年的进程过半,AI技术的价值愈发显现,其核心在于应用的广泛性。各大科技巨头,包括互联网公司与手机制造商,纷纷投入资源寻找杀手级应用,这一趋势在顶级学术会议上也得到了印证。
焦点集中在如何使大模型在手机等资源受限的设备上流畅运行。在...
原文链接
加载更多
暂无内容