8月23日,苹果研究团队开源了SlowFast-LLaVA-1.5长视频多模态大语言模型,在1B、3B、7B参数规模下刷新LongVideoBench、MLVU等基准纪录。该模型通过创新双流设计,‘慢流’捕捉高分辨率场景细节,‘快流’追踪运动变化,解决现有模型冗余帧和上下文窗口限制等问题。新版本在视频与图像理解任务中表现出色,涵盖知识问答、数学推理及OCR等领域,并兼容公开数据集训练,已在GitHub和Hugging Face开源。
原文链接
本文链接:https://kx.umi6.com/article/24057.html
转载请注明文章出处
相关推荐
换一换
苹果回应马斯克指控:App Store设计上公平且无偏见
2025-08-13 14:37:51
库克虎口夺食:马斯克盯上的北大校友AI公司被苹果抢走
2025-10-11 12:26:14
再不发力AI就晚了!华尔街警告:苹果恐处于 “黑莓时刻”
2025-08-09 14:35:10
塑料兄弟情!OpenAI怒斥苹果草率应付合作 反被苹果控诉挖走40名大将
2026-05-15 16:56:33
巨鲸来袭,苹果进军机器人市场
2025-12-09 12:34:55
AI搜索引擎,苹果决定自研!代号WKA
2025-09-04 09:57:52
大摩:苹果大幅增加台积电SoIC产能预约 目标直指“Baltra”AI服务器芯片
2026-04-13 16:08:03
AI投资洪流中,苹果如何另辟蹊径“稳扎稳打”?
2025-10-31 10:28:00
苹果计划为Siri开发基于人工智能的网页搜索工具 以与OpenAI竞争
2025-09-04 04:55:53
App Store年成交1.4万亿美元 AI应用打开增量成长空间
2026-06-05 01:32:40
苹果核心AI人才持续外流 机器人研究负责人跳槽至Meta
2025-09-03 09:46:04
苹果用上了安卓AI,马斯克为啥急得跳脚?
2026-01-15 11:35:02
苹果人工智能团队再现人才流失:一位机器人专家已跳槽Meta
2025-09-03 16:48:57
764 文章
713857 浏览
24小时热文
更多
-
2026-06-10 01:48:40 -
2026-06-09 22:40:10 -
2026-06-09 19:38:23