1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

趋境科技推出大模型知识推理一体机,革新“全系统推理架构”,旨在帮助企业高效利用推理资源。随着大模型应用的普及,推理端人工智能服务器预计占比将达72.6%,而开源大模型的进展进一步推动了这一趋势。然而,当前的挑战在于,尽管模型效果显著提升,但在实际部署中面临高昂成本和低效问题,形成“不可能三角”。

趋境科技的“大模型知识推理一体机”搭载业界首创的全系统推理架构,通过协同存储、CPU、GPU、NPU等多种设备,释放异构算力,将推理成本降低10倍以上。该一体机支持本地部署大型模型,提供开放API接口,方便第三方调用,用户可定制企业智能助手,实现“开箱即用”。与传统方案相比,这一架构通过“以存换算”技术释放存力,结合“异构协同”思路,释放全系统存力和算力,实现推理吞吐量提升10倍,大幅降低大模型落地成本。

面对国产GPU性能与国际品牌存在差距的问题,趋境科技的全系统推理架构有助于缩小性能差距,增强国产替代方案的竞争力。此外,趋境科技创新性地设计了“融合推理”技术,即使面对新问题也能从历史信息中提取可复用内容,显著提升性能。

趋境科技与清华KVCache.AI团队合作,开源异构推理框架“KTransformers”,在本地运行千亿级大模型时性能优于Llama.cpp,响应延迟降低20倍,性能提升10倍。通过进一步完善商业版本,趋境科技的全系统推理架构在多个关键指标上显著领先业界方案。

长亭科技利用趋境科技的全系统异构推理架构,将其“问津(ChaitinAI)安全大模型”升级为千亿大模型,安全性能大幅提升,包括攻击识别准确率提高至95.8%,检测时延降至秒级,漏洞发现与修复建议更准确,不良内容识别能力增强,安全报告质量显著提高。部署成本降低50%,促进了更多业务融入大模型能力。

随着算力基础设施的完善和利用效率的提升,大模型在金融、安全、电信、教育等多个行业的应用将进一步扩大,趋境科技的全系统推理架构为大模型的普及提供了有力支持,推动全面智能化时代的到来。

原文链接
本文链接:https://kx.umi6.com/article/7261.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
奇瑞 1 亿元成立 AI 机器人新公司;AI Infra 公司趋境科技获天使融资;地平线组建具身智能实验室丨AI情报局
2024-08-21 12:33:01
趋境科技&英特尔生态沙龙举办,硬件、推理引擎、上层应用生态融合,打通大模型私有化“最后一公里”
2025-06-11 12:08:24
趋境科技发布大模型知识推理一体机,首创“全系统推理架构”助力企业实现高效推理
2024-10-11 18:07:02
趋境科技与金航数码拓展人工智能合作场景,支持空天领域数字化建设
2025-12-09 17:52:22
高瓴创投(GL Ventures)、Z基金领投,趋境科技完成数千万元融资
2025-02-27 14:22:11
共推空天领域智能化升级!趋境科技与金航数码强强联手
2025-12-09 18:50:41
美国国防部官员称目前未与Anthropic进行任何实质性谈判
2026-03-06 11:57:53
央视点赞千问APP,“AI办事”让人工智能走进日常生活
2026-03-07 16:42:54
劝视频博主别拿龙虾起号 7×24小时全自动 碳基生物真卷不过
2026-03-07 00:47:12
美国拟将AI芯片出口管制扩展至全球 英伟达、AMD等公司出口需获许可
2026-03-06 06:31:53
麦肯锡:AI不是对手而是工具 善用AI的毕业生就业更吃香
2026-03-06 23:43:55
郑栅洁:从未来发展考虑 将推进人工智能超大规模智算集群、卫星互联网、可控核聚变等一系列重大工程和项目
2026-03-06 17:23:58
OpenAI聘请OpenClaw AI智能体开发者斯坦伯格
2026-03-09 21:13:27
24小时热文
更多
扫一扫体验小程序