
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
6月28日,我国首个发电行业专业大模型“擎源”在北京发布,模型参数达千亿级别,是全球首个千亿级发电行业大模型。该模型基于国家能源集团电力装机规模,融合高质量数据集,覆盖火电、水电、新能源等多个业务领域,提供41个智能体,解决安全风险管控、电力交易决策等痛点,推动发电行业实现智慧化转型,构建开放共享的智慧能源生态体系。
原文链接
近日,由新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员联合开发的「拖拽式大语言模型」(DnD)引发关注。该模型基于提示词快速生成任务专属参数,无需微调即可适应不同场景,效率比传统方法提升12000倍。DnD通过轻量级文本编码器与级联超卷积解码器,在数秒内生成LoRA权重矩阵,展现出卓越的零样本泛化能力。实验表明,其在数学、代码及多模态任务中性能优于现有方法,且仅需无标签提示词即可完成适配。这项技术为大模型快速专业化提供了高效解决方案,有望推动AI应用落地。
原文链接
今日,《科创板日报》报道,人工智能公司DeepSeek在AI开源社区Hugging Face发布了全新模型DeepSeek-Prover-V2-671B。该模型参数量高达6710亿,是Prover-V1.5的升级版,采用更高效的safetensors文件格式并支持多计算精度,便于快速训练与部署。其架构基于DeepSeek-V3,运用MoE混合专家模式,含61层Transformer层及7168维隐藏层,支持超长上下文,最大位置嵌入达16.38万,可高效处理复杂数学证明任务。此外,模型通过FP8量化技术优化推理效率,减小模型体积。此模型的发布标志着深度学习领域的重要进展,值得关注。
原文链接
3月4日,大模型独角兽智谱发布了首个支持生成汉字的开源文生图模型——CogView4。该模型在DPG-Bench基准测试中综合评分第一,并且是首个遵循Apache 2.0协议的图像生成模型。GitHub页面显示,CogView4具有60亿参数,支持原生中文输入和中文文本到图像生成。开源地址:
原文链接
OpenAI即将发布GPT-4.5,本周内上线。该模型拥有1T激活参数和120T训练数据,上下文窗口长度达256K,并具备多模态能力。GPT-4.5会在安卓版ChatGPT的Pro订阅用户中率先开放,每月200美元。值得注意的是,GPT-4.5在某些任务上的表现参差不齐,可能在编程等领域不如Claude 3.7 Sonnet。此外,GPT-4.5还能制作动画SVG文件和零样本音乐,但不支持受版权保护的歌曲。本周四已临近发布日期,具体发布时间仍待确认。
原文链接
英伟达在CES 2025上发布了全球最小的个人AI超级计算机‘Project Digits’,计划5月上市。该设备配备GB10 Grace Blackwell超级芯片,支持最多2000亿参数的AI模型。每台设备拥有128GB统一内存及最高4TB NVMe高速存储,通过连接两台设备可处理高达4050亿参数的模型。Project Digits还支持最新的Nvidia AI Enterprise软件套件,简化了AI模型的开发、测试及部署流程,显著缩短模型迭代周期。此创新设计为数据科学家、研究人员、学生及开发者提供了高效的本地开发环境。
原文链接
微软论文意外曝光GPT核心机密:4o-mini仅8B,o1约300B
微软在一篇论文中意外透露了OpenAI模型的参数细节。论文显示,GPT-4o-mini约有8B参数,o1-preview约300B参数。此外,微软还提到了其他模型的参数,包括GPT-4o约200B,Claude 3.5 Sonne...
原文链接
【摘要】在2024年世界互联网大会乌镇峰会上,荣耀CEO赵明透露,预计到2027年,手机将能够搭载千亿参数的大模型。当前市面上的AI手机所使用的大模型参数大多在几十亿至百亿级别。千亿参数大模型将具备更强的学习、理解和预测能力,能更精准地辅助用户规划生活和工作安排。这一技术进步将极大提升手机的人工智能水平,有望带来更加智能化的生活体验。(2024年11月21日发布)
原文链接
有生命的AI?AI Agent的应用远不止游戏NPC
AI与游戏的关系由来已久。过去,AI在游戏中不断提升自身的能力,电子游戏、象棋、围棋等都曾是AI的训练场。如今,AI不仅提升了游戏制作的效率,还能赋予游戏角色鲜活的生命力,让NPC仿佛拥有真实灵魂。
超参数科技推出的“活的长安城”Demo展示了这...
原文链接
【苹果推出300亿参数多模态AI大模型MM1.5】苹果公司在10月13日发布了一款名为MM1.5的多模态AI大模型,该模型拥有300亿参数,是基于前代MM1架构发展而来。MM1.5在数据驱动的训练原则下,着重研究不同训练周期中混合数据对模型性能的影响,并在Hugging Face平台上发布了相关模型...
原文链接
加载更多

暂无内容