1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

8月23日,苹果研究团队开源了SlowFast-LLaVA-1.5长视频多模态大语言模型,在1B、3B、7B参数规模下刷新LongVideoBench、MLVU等基准纪录。该模型通过创新双流设计,‘慢流’捕捉高分辨率场景细节,‘快流’追踪运动变化,解决现有模型冗余帧和上下文窗口限制等问题。新版本在视频与图像理解任务中表现出色,涵盖知识问答、数学推理及OCR等领域,并兼容公开数据集训练,已在GitHub和Hugging Face开源。

原文链接
本文链接:https://kx.umi6.com/article/24057.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AI搜索引擎,苹果决定自研!代号WKA
2025-09-04 09:57:52
苹果向英伟达生态妥协了!MLX框架主动适配CUDA
2025-07-17 14:22:02
iPhone大卖,给不了苹果安全感
2025-08-03 11:36:33
苹果阿里AI合作或遭白宫阻扰?美媒:对苹果损失更大
2025-05-22 20:35:42
苹果又一位AI研究员将跳槽Meta 核心模型团队动荡加剧
2025-07-30 02:37:25
苹果又陷版权泥潭!被起诉使用盗版书籍训练AI
2025-10-14 09:09:42
马斯克指责苹果在应用商店偏袒OpenAI 奥特曼回应:希望对马斯克操纵X展开调查
2025-08-12 11:22:32
郭明錤:苹果AI表现或令投资人失望 恐影响AR眼镜
2025-06-10 09:45:28
迟到七年的折叠屏iPhone,是“最不苹果”的苹果产品
2025-07-21 13:18:46
加速芯片开发之路!苹果高管:有意在芯片设计中引入生成式AI
2025-06-19 16:53:57
苹果准备放出AI底牌:向开发者开放大模型权限
2025-05-21 07:55:27
库克你赶紧退休,放过苹果吧
2025-07-08 15:51:49
苹果研究破解 AI“英语口音”难题,提升多语言自然性
2025-05-17 07:02:43
24小时热文
更多
扫一扫体验小程序