8月23日,苹果研究团队开源了SlowFast-LLaVA-1.5长视频多模态大语言模型,在1B、3B、7B参数规模下刷新LongVideoBench、MLVU等基准纪录。该模型通过创新双流设计,‘慢流’捕捉高分辨率场景细节,‘快流’追踪运动变化,解决现有模型冗余帧和上下文窗口限制等问题。新版本在视频与图像理解任务中表现出色,涵盖知识问答、数学推理及OCR等领域,并兼容公开数据集训练,已在GitHub和Hugging Face开源。
原文链接
本文链接:https://kx.umi6.com/article/24057.html
转载请注明文章出处
相关推荐
换一换
扎克伯格挖角苹果基础模型团队负责人 更多员工或离开
2025-07-08 16:51:34
苹果据悉探索利用谷歌Gemini为新版Siri赋能
2025-08-23 02:55:42
苹果创新“清单法”:用 AI 大模型当“老师”,教小模型更精准执行复杂指令
2025-08-26 07:38:55
AI版Siri虽迟但到?苹果或联手谷歌Gemini 升级iPhone搜索功能
2025-09-04 12:01:25
OpenAI想杀入苹果“腹地”
2025-09-20 18:33:36
AI投资洪流中,苹果如何另辟蹊径“稳扎稳打”?
2025-10-31 10:28:00
提速 128 倍:苹果发布 FS-DFM 模型,AI 长文写作不再等待
2025-10-14 14:18:04
苹果发布论文坚称 AI 训练符合道德原则,且尊重出版商权益
2025-07-22 00:23:59
为助Siri全面升级AI服务,苹果据称将与谷歌“联手”!
2025-11-06 08:50:14
再不发力AI就晚了!华尔街警告:苹果恐处于 “黑莓时刻”
2025-08-09 14:35:10
Siri的AI升级功能短期内不会推出
2025-06-10 15:52:53
苹果又陷版权泥潭!被起诉使用盗版书籍训练AI
2025-10-14 09:09:42
巨鲸来袭,苹果进军机器人市场
2025-12-09 12:34:55
699 文章
522891 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18