5月17日消息,开源大语言模型服务工具Ollama推出自主研发的多模态AI定制引擎,逐步摆脱对llama.cpp框架的依赖。该引擎针对本地推理性能进行了优化,特别是在处理大图像生成大量token时表现优异。Ollama团队强调,其引擎采用golang独立开发,未直接借鉴llama.cpp的C++实现,并感谢社区反馈改进技术。随着Meta、Google、阿里巴巴等推出复杂性增加的模型,现有架构面临挑战,Ollama的新引擎引入图像处理附加元数据,优化批量处理和位置数据管理,同时通过KVCache技术加速transformer模型推理速度。此外,新引擎优化内存管理并新增图像缓存功能,联合NVIDIA、AMD、Qualcomm、Intel和Microsoft等优化硬件元数据,提升内存估算精度。未来,Ollama计划支持更长上下文长度、复杂推理过程及工具调用流式响应,以增强本地AI模型的多功能性。
原文链接
本文链接:https://kx.umi6.com/article/18748.html
转载请注明文章出处
相关推荐
换一换
无编程经验也能本地玩转 AI:Win10 / Win11 版 Ollama 应用上线
2025-08-01 16:02:18
服务器总是繁忙 DeepSeek-R1本地部署图文版教程来了
2025-02-14 17:41:59
国家网络安全通报中心通报:大模型工具 Ollama 存在安全风险
2025-03-03 19:33:30
AI太烧钱!Meta裁员8000人再冻6000职位
2026-04-24 16:19:57
美格智能发布新一代中央计算架构5G舱联AI模组
2026-04-24 15:18:33
阿里云百炼上线DeepSeek-V4
2026-04-24 20:31:56
网友称用AI提前查到事业编成绩 官方回应:测试时意外进入 无不良影响
2026-04-24 18:27:05
国家知识产权局:人工智能、芯片、脑机接口纳入“快保护”通道
2026-04-24 12:10:22
Nature封面:机器人乒乓球干翻人类职业选手
2026-04-23 15:11:01
DeepSeek-V4上线国家超算互联网
2026-04-24 18:30:24
中信证券:物理AI蓬勃发展 场景落地有望提速
2026-04-24 09:03:22
昇腾超节点系列产品全面支持DeepSeek V4新模型
2026-04-24 13:15:05
新模型上线期间出现功能异常 月之暗面公布补偿方案:全员额度重置
2026-04-22 22:32:08
714 文章
583042 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38