2026年5月,Redis之父Salvatore Sanfilippo(antirez)为DeepSeek V4 Flash打造了一款专属本地推理引擎ds4.c。该引擎基于C+Metal从头编写,专为Apple Silicon优化,不支持其他硬件。通过非对称量化、KV缓存硬盘存储及内置OpenAI和Anthropic API兼容层,ds4.c在Mac上实现了高效推理。测试显示,在128GB内存的M3 Max MacBook Pro上,短prompt生成速度达26.68 token/s。antirez强调,该项目专注于单一模型的极致优化,而非通用性。此项目引发开发者对“一个模型一个推理框架”趋势的讨论。ds4.c开发过程中借助了GPT 5.5辅助,体现了AI协作编程的新模式。
原文链接
本文链接:https://kx.umi6.com/article/35575.html
转载请注明文章出处
相关推荐
换一换
存储三巨头押注DRAM新技术 或打开两类接口芯片空间
2026-05-06 16:28:24
中天科技在酒泉成立储能科技公司
2026-05-07 12:21:28
人口仅1.6万!加勒比小岛靠.ai域名躺赚 年入超5亿还将持续暴涨
2026-05-07 16:28:52
第一批「AI原生」本科生,要毕业了
2026-05-08 12:15:48
蔚来在安庆成立新能源科技公司 含AI软件开发业务
2026-05-08 11:19:21
工信部:加快形成人工智能终端产品目录 拓展人工智能应用广度深度
2026-05-08 17:33:08
欧盟禁止AI生成深度伪造色情内容:绝不能用人工智能羞辱他人
2026-05-07 23:45:05
三部门:力争到2030年 人工智能算力设施的清洁能源供给保障能力和能源领域人工智能应用水平大幅提升
2026-05-08 17:30:58
GPT-5级推理能力塞进语音模型,OpenAI把同传翻译成本砍穿地板价
2026-05-08 13:19:40
全国首款 上海研发的医疗大模型产品进入国家创新医疗器械特别审查通道
2026-05-07 19:36:56
美国AI公司Anthropic高管下周将访韩
2026-05-06 21:39:30
每日互动:一季度公司AI相关业务收入已接近去年全年水平
2026-05-08 11:14:52
李飞飞押注的AI游戏平台火了!Astrocade融资5600万美元
2026-05-07 11:13:38
705 文章
596064 浏览
24小时热文
更多
-
2026-05-08 18:40:47 -
2026-05-08 18:39:42 -
2026-05-08 18:38:38