
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
当地时间9月9日,阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)与阿联酋AI公司G42联合推出低成本推理模型K2 Think。该模型仅需320亿参数,性能却超越规模大20倍的其他推理模型。K2 Think基于阿里巴巴开源Qwen 2.5模型构建,并在Cerebras硬件上运行和测试。团队通过长链式思维监督微调(CoT)和推理阶段扩展等技术实现高性能表现。这一成果标志着阿联酋在高效AI模型研发领域取得重要进展,为全球AI技术应用提供了更具成本效益的解决方案。
原文链接
9月9日,阿联酋穆罕默德·本·扎耶德人工智能大学与G42联合发布低成本AI推理模型“K2 Think”。该模型基于阿里巴巴开源Qwen 2.5构建,仅需320亿参数,性能却超越规模大20倍的模型,宣称性价比超同行20倍。通过长链式思维监督微调和推理阶段扩展等技术,“K2 Think”在数学、科学等特定领域表现出色。这一成果展示了阿联酋在AI领域的创新能力,同时凸显开源技术对全球AI发展的推动作用。
原文链接
美国得克萨斯大学圣安东尼奥分校(UTSA)研究人员开发了一种基于AI的低成本显微镜系统,用于快速检测土壤真菌,助力土壤健康评估。该技术结合机器学习与光学显微镜,通过分析土壤样本视频和图像识别真菌生物量,已在7月9日布拉格戈德施密特会议上展示。研究负责人亚历克・格雷夫斯表示,这一方法可降低传统检测成本,减少对专家依赖,并提供更全面的土壤生物学数据。团队计划未来两年内将技术整合至移动机器人平台,实现从采样到分析的一体化设备。该研究由UTSA教授萨加塔・达塔领导,详细算法预计今年晚些时候发表于同行评审期刊。
原文链接
UC伯克利推出5000美元全开源人形机器人,网友直呼“抄作业”!
只需5000美元就能实现人形机器人3D打印?UC伯克利再次带来惊喜!视频中的小家伙正是UC伯克利最新作品——人形机器人Berkeley Humanoid Lite(BHL),正一笔一划认真书写“Hello world”。
BHL身高不...
原文链接
标题:语音界Deepseek!百度最新跨模态端到端语音交互,成本最高降90%
百度推出行业首个基于Cross-Attention的端到端语音语言大模型,大幅提升语音交互的真实性和情感表达,同时大幅降低语音问答场景的调用成本,最高降幅达90%。
该模型通过创新的跨模态架构,将语音识别和语言模型深度融合...
原文链接
11B参数模型开源视频生成再创SOTA!训练成本降低10倍。
224张GPU训练,Open-Sora 2.0发布。模型参数达11B,性能媲美30B规模的闭源模型,但成本仅为20万美元。
支持720P、24FPS高画质,生成动作流畅自然。画面细节丰富,场景切换无缝衔接,超越多项开源与商业模型。
创新采用3D自编码器、Flow Matching框架及MMDiT架构,通过多桶训练和3D全注意力机制提升生成质量。同时,开源全流程训练代码,打造强大开源生态。
高压缩比自编码器将推理速度提升10倍,大幅降低生成成本。欢迎访问GitHub仓库,加入社区共同推进AI视频技术发展。
原文链接
2月18日,DeepSeek宣布推出NSA(Native Sparse Attention),一种硬件对 alignments 且原生可训练的稀疏注意力机制,旨在加速推理并降低成本,同时保持性能。NSA的核心组件包括动态分层稀疏策略、粗粒度token压缩及细粒度token选择。DeepSeek表示,该机制在通用基准、长上下文任务和基于指令的推理中表现出色,不逊于全注意力模型。更多信息参见:
原文链接
斯坦福大学和华盛顿大学的研究人员以不足50美元的云计算费用,训练出名为s1的人工智能推理模型,表现与OpenAI的O1和DeepSeek的R1相当。然而,该模型并非从零开始,而是基于阿里云通义千问模型进行微调。青年AI科学家谢伟迪表示,s1模型的1000个样本训练更像是“锦上添花”。这种低成本训练依赖于强大的基座模型,且1000个样本在大多数情况下不足以训练出复杂的模型。此外,该方法引发了对AI模型知识产权和伦理问题的讨论。尽管存在争议,这一研究为AI领域提供了新的思考方向。
原文链接
斯坦福大学和华盛顿大学的研究人员以不足50美元的云计算费用,利用阿里云通义千问(Qwen)模型进行微调,训练出了名为s1的人工智能推理模型。该模型在数学和编码能力测试中表现出色,与OpenAI的O1和DeepSeek的R1模型相当。青年AI科学家谢伟迪指出,s1模型的训练仅使用了1000个样本数据,更像是对已有强大能力的通义千问模型进行微调。尽管这种低成本训练展示了AI训练的潜力,但也引发了对AI模型知识产权和伦理问题的讨论。未来,降低成本同时保持高性能仍是AI研究的重要课题。
原文链接
中国AI大模型创业公司DeepSeek发布了DeepSeek-R1,其在多项基准测试中与OpenAI o1表现相当,尤其在数学和编码任务上。DeepSeek-R1的成本仅为OpenAI o1的三十分之一,引起全球AI圈关注。DeepSeek团队采用直接强化学习方法,省去了大量人工标注数据,大幅降低训练成本。DeepSeek-R1开源并支持商业用途,有望为小公司提供新机会。这一成果显示优化和高效利用资源的重要性,引发关于中国AI发展的讨论。
原文链接
加载更多

暂无内容