低成本 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

阿联酋推出低成本AI推理模型K2 Think

当地时间9月9日，阿联酋穆罕默德·本·扎耶德人工智能大学（MBZUAI）与阿联酋AI公司G42联合推出低成本推理模型K2 Think。该模型仅需320亿参数，性能却超越规模大20倍的其他推理模型。K2 Think基于阿里巴巴开源Qwen 2.5模型构建，并在Cerebras硬件上运行和测试。团队通过长链式思维监督微调（CoT）和推理阶段扩展等技术实现高性能表现。这一成果标志着阿联酋在高效AI模型研发领域取得重要进展，为全球AI技术应用提供了更具成本效益的解决方案。

原文链接

未来笔触

09-10 12:36:02

K2 Think

低成本AI模型

阿联酋

分享至

打开微信扫一扫

内容投诉

生成图片

阿联酋基于阿里巴巴Qwen 2.5推出低成本AI推理模型宣称“性价比”超同行20倍

9月9日，阿联酋穆罕默德·本·扎耶德人工智能大学与G42联合发布低成本AI推理模型“K2 Think”。该模型基于阿里巴巴开源Qwen 2.5构建，仅需320亿参数，性能却超越规模大20倍的模型，宣称性价比超同行20倍。通过长链式思维监督微调和推理阶段扩展等技术，“K2 Think”在数学、科学等特定领域表现出色。这一成果展示了阿联酋在AI领域的创新能力，同时凸显开源技术对全球AI发展的推动作用。

原文链接

GhostPilot

09-09 22:23:41

Qwen 2.5

低成本AI推理模型

阿联酋

分享至

打开微信扫一扫

内容投诉

生成图片

AI 赋能传统显微镜，美研团队研发低成本土壤真菌检测系统

美国得克萨斯大学圣安东尼奥分校（UTSA）研究人员开发了一种基于AI的低成本显微镜系统，用于快速检测土壤真菌，助力土壤健康评估。该技术结合机器学习与光学显微镜，通过分析土壤样本视频和图像识别真菌生物量，已在7月9日布拉格戈德施密特会议上展示。研究负责人亚历克・格雷夫斯表示，这一方法可降低传统检测成本，减少对专家依赖，并提供更全面的土壤生物学数据。团队计划未来两年内将技术整合至移动机器人平台，实现从采样到分析的一体化设备。该研究由UTSA教授萨加塔・达塔领导，详细算法预计今年晚些时候发表于同行评审期刊。

原文链接

数码游侠

07-07 18:34:19

AI赋能

低成本显微镜

土壤真菌检测

分享至

打开微信扫一扫

内容投诉

生成图片

UC伯克利5千美元造全开源人形机器人，网友：这作业抄定了

UC伯克利推出5000美元全开源人形机器人，网友直呼“抄作业”！只需5000美元就能实现人形机器人3D打印？UC伯克利再次带来惊喜！视频中的小家伙正是UC伯克利最新作品——人形机器人Berkeley Humanoid Lite（BHL），正一笔一划认真书写“Hello world”。 BHL身高不...

原文链接

未来笔触

05-20 18:43:16

人形机器人

低成本

开源

分享至

打开微信扫一扫

内容投诉

生成图片

语音界Deepseek！百度最新跨模态端到端语音交互，成本最高降90%

标题：语音界Deepseek！百度最新跨模态端到端语音交互，成本最高降90% 百度推出行业首个基于Cross-Attention的端到端语音语言大模型，大幅提升语音交互的真实性和情感表达，同时大幅降低语音问答场景的调用成本，最高降幅达90%。该模型通过创新的跨模态架构，将语音识别和语言模型深度融合...

原文链接

智能涌动

04-02 16:31:19

低成本

百度

语音交互

分享至

打开微信扫一扫

内容投诉

生成图片

11B模型拿开源视频生成SOTA！仅用224张GPU训练，训练成本省10倍

11B参数模型开源视频生成再创SOTA！训练成本降低10倍。 224张GPU训练，Open-Sora 2.0发布。模型参数达11B，性能媲美30B规模的闭源模型，但成本仅为20万美元。支持720P、24FPS高画质，生成动作流畅自然。画面细节丰富，场景切换无缝衔接，超越多项开源与商业模型。创新采用3D自编码器、Flow Matching框架及MMDiT架构，通过多桶训练和3D全注意力机制提升生成质量。同时，开源全流程训练代码，打造强大开源生态。高压缩比自编码器将推理速度提升10倍，大幅降低生成成本。欢迎访问GitHub仓库，加入社区共同推进AI视频技术发展。

原文链接

蝶舞CyberSwirl

03-13 13:15:44

低成本

开源

视频生成

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek 再放降本大招：NSA 官宣发布，加速推理降低成本，并且不牺牲性能

2月18日，DeepSeek宣布推出NSA（Native Sparse Attention），一种硬件对 alignments 且原生可训练的稀疏注意力机制，旨在加速推理并降低成本，同时保持性能。NSA的核心组件包括动态分层稀疏策略、粗粒度token压缩及细粒度token选择。DeepSeek表示，该机制在通用基准、长上下文任务和基于指令的推理中表现出色，不逊于全注意力模型。更多信息参见：

原文链接

智慧轨迹

02-18 17:24:09

NSA

稀疏注意力机制

降低成本

分享至

打开微信扫一扫

内容投诉

生成图片

李飞飞团队“50美元”复现DeepSeek R1真相：基座曝光

斯坦福大学和华盛顿大学的研究人员以不足50美元的云计算费用，训练出名为s1的人工智能推理模型，表现与OpenAI的O1和DeepSeek的R1相当。然而，该模型并非从零开始，而是基于阿里云通义千问模型进行微调。青年AI科学家谢伟迪表示，s1模型的1000个样本训练更像是“锦上添花”。这种低成本训练依赖于强大的基座模型，且1000个样本在大多数情况下不足以训练出复杂的模型。此外，该方法引发了对AI模型知识产权和伦理问题的讨论。尽管存在争议，这一研究为AI领域提供了新的思考方向。

原文链接

量子黑客

02-07 09:55:00

低成本训练

李飞飞

通义千问

分享至

打开微信扫一扫

内容投诉

生成图片

李飞飞团队“50美元”复现DeepSeek R1真相：基座为阿里云Qwen模型

斯坦福大学和华盛顿大学的研究人员以不足50美元的云计算费用，利用阿里云通义千问(Qwen)模型进行微调，训练出了名为s1的人工智能推理模型。该模型在数学和编码能力测试中表现出色，与OpenAI的O1和DeepSeek的R1模型相当。青年AI科学家谢伟迪指出，s1模型的训练仅使用了1000个样本数据，更像是对已有强大能力的通义千问模型进行微调。尽管这种低成本训练展示了AI训练的潜力，但也引发了对AI模型知识产权和伦理问题的讨论。未来，降低成本同时保持高性能仍是AI研究的重要课题。

原文链接

阿达旻

02-06 20:39:58

低成本训练

李飞飞

阿里云Qwen

分享至

打开微信扫一扫

内容投诉

生成图片

成本仅国外三十分之一，中国大模型已经追上美国了？

中国AI大模型创业公司DeepSeek发布了DeepSeek-R1，其在多项基准测试中与OpenAI o1表现相当，尤其在数学和编码任务上。DeepSeek-R1的成本仅为OpenAI o1的三十分之一，引起全球AI圈关注。DeepSeek团队采用直接强化学习方法，省去了大量人工标注数据，大幅降低训练成本。DeepSeek-R1开源并支持商业用途，有望为小公司提供新机会。这一成果显示优化和高效利用资源的重要性，引发关于中国AI发展的讨论。

原文链接