5月17日消息,开源大语言模型服务工具Ollama推出自主研发的多模态AI定制引擎,逐步摆脱对llama.cpp框架的依赖。该引擎针对本地推理性能进行了优化,特别是在处理大图像生成大量token时表现优异。Ollama团队强调,其引擎采用golang独立开发,未直接借鉴llama.cpp的C++实现,并感谢社区反馈改进技术。随着Meta、Google、阿里巴巴等推出复杂性增加的模型,现有架构面临挑战,Ollama的新引擎引入图像处理附加元数据,优化批量处理和位置数据管理,同时通过KVCache技术加速transformer模型推理速度。此外,新引擎优化内存管理并新增图像缓存功能,联合NVIDIA、AMD、Qualcomm、Intel和Microsoft等优化硬件元数据,提升内存估算精度。未来,Ollama计划支持更长上下文长度、复杂推理过程及工具调用流式响应,以增强本地AI模型的多功能性。
原文链接
本文链接:https://kx.umi6.com/article/18748.html
转载请注明文章出处
相关推荐
换一换
服务器总是繁忙 DeepSeek-R1本地部署图文版教程来了
2025-02-14 17:41:59
Ollama 上线自研多模态 AI 引擎:逐步摆脱 llama.cpp 框架依赖,本地推理性能飙升
2025-05-17 15:06:57
国家网络安全通报中心通报:大模型工具 Ollama 存在安全风险
2025-03-03 19:33:30
无编程经验也能本地玩转 AI:Win10 / Win11 版 Ollama 应用上线
2025-08-01 16:02:18
微博 CEO 王高飞回应能否让 AI 手机自己发微博:需要确认
2025-12-08 09:17:44
加快发展新质生产力 上海自动驾驶测试道路总里程超5200公里
2025-12-07 13:29:51
山东省“十五五”规划建议:大力推进人工智能创新应用 支持创建一批国家人工智能应用中试基地
2025-12-08 09:22:21
OpenAI:科技、医疗和制造业是人工智能增长最快的行业
2025-12-08 20:47:34
华为面向医疗领域发布 AI 数据平台,涵盖知识生成与检索等
2025-12-07 18:40:26
工信部召开务虚会 研究谋划“十五五”及开局之年工作
2025-12-07 15:35:49
国家医保数字人“医小保”介绍商保目录:19款药品入选 9个为1类新药
2025-12-07 13:30:59
Oculus 创始人拉奇为在战争中使用 AI 辩护:使用落后技术并无道德高地可言
2025-12-08 09:15:22
谷歌 DeepMind CEO 哈萨比斯:规模定律是走向通用人工智能的关键
2025-12-08 09:16:34
603 文章
362956 浏览
24小时热文
更多
-
2025-12-08 23:53:52 -
2025-12-08 22:52:38 -
2025-12-08 22:51:57