5月17日消息,开源大语言模型服务工具Ollama推出自主研发的多模态AI定制引擎,逐步摆脱对llama.cpp框架的依赖。该引擎针对本地推理性能进行了优化,特别是在处理大图像生成大量token时表现优异。Ollama团队强调,其引擎采用golang独立开发,未直接借鉴llama.cpp的C++实现,并感谢社区反馈改进技术。随着Meta、Google、阿里巴巴等推出复杂性增加的模型,现有架构面临挑战,Ollama的新引擎引入图像处理附加元数据,优化批量处理和位置数据管理,同时通过KVCache技术加速transformer模型推理速度。此外,新引擎优化内存管理并新增图像缓存功能,联合NVIDIA、AMD、Qualcomm、Intel和Microsoft等优化硬件元数据,提升内存估算精度。未来,Ollama计划支持更长上下文长度、复杂推理过程及工具调用流式响应,以增强本地AI模型的多功能性。
原文链接
本文链接:https://kx.umi6.com/article/18748.html
转载请注明文章出处
相关推荐
换一换
Ollama 上线自研多模态 AI 引擎:逐步摆脱 llama.cpp 框架依赖,本地推理性能飙升
2025-05-17 15:06:57
国家网络安全通报中心通报:大模型工具 Ollama 存在安全风险
2025-03-03 19:33:30
无编程经验也能本地玩转 AI:Win10 / Win11 版 Ollama 应用上线
2025-08-01 16:02:18
服务器总是繁忙 DeepSeek-R1本地部署图文版教程来了
2025-02-14 17:41:59
广东:支持各地市稳妥有序开放自动驾驶多场景道路测试应用 扩大高级别自动驾驶应用区域
2026-01-21 17:22:28
中国电信等在天津成立低空量子网络科技发展公司
2026-01-23 10:50:21
成都国资开年「闪击战」背后的产业野望
2026-01-21 20:24:37
OpenAI已建立人形机器人实验室 启动以来规模扩大四倍多
2026-01-22 21:11:56
广东:保障算力算法与网络供给 鼓励在重点路段、桥隧、港口及枢纽场站部署边缘计算节点
2026-01-21 16:20:44
黄仁勋谈AI泡沫:泡沫产生是因为投资规模空前庞大 巨额投资是为了构建AI基础设施
2026-01-22 16:01:49
昇腾云客户2663家,华为云稳居最大国产AI云服务提供商
2026-01-22 17:01:32
广东:推广邮政快递末端智能收派服务 推动无人车、无人机与智能快件箱协同配送
2026-01-21 17:22:35
苏州“十五五”规划建议:培育壮大半导体与集成电路、智能网联新能源汽车、工业母机等新兴支柱产业
2026-01-21 20:30:12
645 文章
433509 浏览
24小时热文
更多
-
2026-01-23 17:11:08 -
2026-01-23 17:10:00 -
2026-01-23 17:08:55