1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

趋境科技推出大模型知识推理一体机,革新“全系统推理架构”,旨在帮助企业高效利用推理资源。随着大模型应用的普及,推理端人工智能服务器预计占比将达72.6%,而开源大模型的进展进一步推动了这一趋势。然而,当前的挑战在于,尽管模型效果显著提升,但在实际部署中面临高昂成本和低效问题,形成“不可能三角”。

趋境科技的“大模型知识推理一体机”搭载业界首创的全系统推理架构,通过协同存储、CPU、GPU、NPU等多种设备,释放异构算力,将推理成本降低10倍以上。该一体机支持本地部署大型模型,提供开放API接口,方便第三方调用,用户可定制企业智能助手,实现“开箱即用”。与传统方案相比,这一架构通过“以存换算”技术释放存力,结合“异构协同”思路,释放全系统存力和算力,实现推理吞吐量提升10倍,大幅降低大模型落地成本。

面对国产GPU性能与国际品牌存在差距的问题,趋境科技的全系统推理架构有助于缩小性能差距,增强国产替代方案的竞争力。此外,趋境科技创新性地设计了“融合推理”技术,即使面对新问题也能从历史信息中提取可复用内容,显著提升性能。

趋境科技与清华KVCache.AI团队合作,开源异构推理框架“KTransformers”,在本地运行千亿级大模型时性能优于Llama.cpp,响应延迟降低20倍,性能提升10倍。通过进一步完善商业版本,趋境科技的全系统推理架构在多个关键指标上显著领先业界方案。

长亭科技利用趋境科技的全系统异构推理架构,将其“问津(ChaitinAI)安全大模型”升级为千亿大模型,安全性能大幅提升,包括攻击识别准确率提高至95.8%,检测时延降至秒级,漏洞发现与修复建议更准确,不良内容识别能力增强,安全报告质量显著提高。部署成本降低50%,促进了更多业务融入大模型能力。

随着算力基础设施的完善和利用效率的提升,大模型在金融、安全、电信、教育等多个行业的应用将进一步扩大,趋境科技的全系统推理架构为大模型的普及提供了有力支持,推动全面智能化时代的到来。

原文链接
本文链接:https://kx.umi6.com/article/7261.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
趋境科技与金航数码拓展人工智能合作场景,支持空天领域数字化建设
2025-12-09 17:52:22
趋境科技&英特尔生态沙龙举办,硬件、推理引擎、上层应用生态融合,打通大模型私有化“最后一公里”
2025-06-11 12:08:24
奇瑞 1 亿元成立 AI 机器人新公司;AI Infra 公司趋境科技获天使融资;地平线组建具身智能实验室丨AI情报局
2024-08-21 12:33:01
高瓴创投(GL Ventures)、Z基金领投,趋境科技完成数千万元融资
2025-02-27 14:22:11
趋境科技发布ATaaS:全球领先的高效能AI Token生产服务平台
2026-03-27 21:21:03
共推空天领域智能化升级!趋境科技与金航数码强强联手
2025-12-09 18:50:41
重磅加盟趋境科技,院士+教授领衔,领跑高效能AI Token生产新生态
2026-03-23 14:19:29
美团内测万亿级新一代大模型,全程基于国产算力集群训练
2026-04-24 12:12:33
广东:推动脑机接口和具身智能等人工智能前沿技术的融合
2026-04-22 17:25:47
天孚通信:1.6T光引擎处于量产状态目前因为个别物料缺料尚未达到预期产量 公司在积极协调供应商努力争取更多交付
2026-04-22 19:25:59
谷歌云推出7.5亿美元基金 助力合作伙伴加速智能体人工智能开发
2026-04-22 20:29:22
两部门:重点在软件和信息服务、数字交付贸易的数据安全与隐私保护、数据要素跨境流动、数字贸易平台建设等方面率先推进标准研制和体系建设
2026-04-23 12:05:12
昇腾超节点系列产品全面支持DeepSeek V4新模型
2026-04-24 13:15:05
24小时热文
更多
扫一扫体验小程序