文章
(666)
1月21日,阿里千问在Hugging Face开源社区刷新纪录,衍生模型突破20万个,下载量超10亿次,日均下载110万次,超越美国Llama居全球第一。衍生模型数量被视为开源影响力的核心指标,自2023年起,阿里已开源近400个大模型,推动开发者基于千问开发新技术与应用,如斯坦福李飞飞团队训练出新模型s1。目前,千问衍生模型日增超200个,覆盖机器人控制、代码生成等多领域。千问支持0.5B到480B参数规模及119种语言,适配多模态应用和小语种AI开发,成为实际应用落地的重要标杆。
原文链接
1月21日,盖茨基金会与OpenAI宣布启动名为Horizon1000的合作计划,将投资5000万美元(约合3.49亿元人民币),利用AI技术改善非洲医疗体系。项目首先在卢旺达推进,目标是到2028年覆盖多个非洲国家的1000家基层医疗诊所及周边社区。比尔·盖茨表示,AI可帮助扩大高质量医疗服务覆盖面,特别是在卫生人力短缺和基础设施薄弱的地区。撒哈拉以南非洲目前医疗卫生人员缺口约600万。此项目启动正值国际援助资金缩减导致可预防儿童死亡人数上升之际,凸显了AI在低收入国家医疗领域的潜力。
原文链接
1月21日,DeepSeek在GitHub更新deepseek-ai/FlashMLA仓库,新增一个未公开模型架构标识“MODEL1”,被提及31次。MODEL1是DeepSeek FlashMLA支持的两大核心模型之一,另一为DeepSeek-V3.2。推测MODEL1为高效推理模型,内存占用低于V3.2,适合边缘设备或成本敏感场景,也可能针对16K+长序列优化,适用于文档理解、代码分析等任务。此次更新涉及114个代码文件,涵盖多种格式。(腾讯科技)
原文链接
韩国AI芯片设计公司FuriosaAI计划通过D轮融资筹集3亿至5亿美元,资金将用于第二代RNGD芯片量产、全球业务扩张及第三代芯片研发。该公司最早预计于2027年上市。此轮融资和未来规划显示其在AI芯片领域的持续发力与市场布局。
原文链接
中信证券研报显示,2026年开年AI应用板块成为A股主线,年初至今涨幅达19%,位居首位。CES2026展会为观察AI落地趋势提供重要窗口,硬件方面,AI已渗透至汽车、机器人、智能眼镜等多元终端及可穿戴设备;软件方面,模型推理能力提升推动企业级AgenticAI加速落地,下一代硬件平台Rubin等降低token和推理成本,进一步促进应用普及。中国在应用落地节奏与用户规模上具优势,AI应用成长空间广阔。
原文链接
2026年1月17日,埃隆·马斯克宣布用于Grok的‘Colossus 2’超级计算机已投入运行,这是全球首个吉瓦级训练集群,并计划于四月升级至1.5吉瓦。该超算位于孟菲斯的xAI设施,建筑面积相当于13个足球场,配备20万块英伟达H100 GPU,规模较启动时翻倍。此外,Colossus还拥有150兆瓦特斯拉Megapack电池作为备用电源。然而,美国环境保护署裁定,xAI在为数据中心供电过程中违规运行天然气涡轮机,违反环保法规,驳回了‘临时使用豁免监管’的说法。这一裁决为一年多审查的结果。
原文链接
1月15日,孚日股份在互动平台回应投资者提问时表示,公司目前在人工智能和机器人领域暂无布局计划。这一表态表明,尽管近年来科技行业快速发展,相关技术应用备受关注,但孚日股份现阶段并未涉足这些前沿领域。此消息或对关注该公司科技转型的投资者产生一定影响。
原文链接
1月14日,OpenAI与晶圆级AI芯片企业Cerebras宣布达成合作协议。根据协议,OpenAI将在2026年至2028年间部署规模达750MW的Cerebras芯片,用于其AI推理计算资源库。OpenAI表示,基于Cerebras芯片的解决方案将显著缩短AI服务的响应时间,为用户提供更实时的交互体验,并支持更高价值的工作负载。这一合作标志着AI基础设施领域的进一步升级,有望提升AI技术的实际应用效率。
原文链接
1月12日,国内首起AI服务涉黄判刑案二审即将开庭。上海市徐汇区人民法院此前一审判决,两名被告人因在AlienChat App中提供与AI‘聊黄’功能,犯制作淫秽物品牟利罪,分别获刑四年和一年半。案件将于1月14日在上海市第一中级人民法院审理。判决书显示,该App通过修改系统提示词突破大语言模型道德限制,吸引11.6万注册用户,其中2.4万人付费,涉案金额达363万余元。开发者不服判决提出上诉,引发广泛关注。AlienChat曾宣传AI为‘朋友、恋人、家人’,但于2024年停止服务。
原文链接
据The Information报道,DeepSeek计划于2月中旬春节前后发布V4模型,主打编码能力。内部测试显示,其性能已超越Anthropic的Claude和OpenAI的GPT系列。V4在超长代码提示词处理与解析上实现突破,且训练全程数据模式理解能力无衰减,较前代显著提升。新模型生成的答案逻辑更清晰、结构更规整,深度推理能力增强,复杂任务可靠性更高。此外,DeepSeek-V3.2论文提到使用大模型竞技场平台进行人类偏好评估,用户可能提前在该平台测试V4。
原文链接
加载更多
24小时热文
更多
-
2026-01-22 11:54:31 -
2026-01-22 11:53:27 -
2026-01-22 11:52:20