1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

8月23日,苹果研究团队开源了SlowFast-LLaVA-1.5长视频多模态大语言模型,在1B、3B、7B参数规模下刷新LongVideoBench、MLVU等基准纪录。该模型通过创新双流设计,‘慢流’捕捉高分辨率场景细节,‘快流’追踪运动变化,解决现有模型冗余帧和上下文窗口限制等问题。新版本在视频与图像理解任务中表现出色,涵盖知识问答、数学推理及OCR等领域,并兼容公开数据集训练,已在GitHub和Hugging Face开源。

原文链接
本文链接:https://kx.umi6.com/article/24057.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
苹果据称新组建了一个新团队:专攻搜索领域 开发ChatGPT竞品
2025-08-04 11:57:24
苹果高管称其计划利用AI设计芯片
2025-06-19 16:56:03
苹果的接班人不会是“第二个库克”
2025-08-05 21:19:38
AI生成快捷指令,苹果AI最有用的一集来了?
2025-06-06 15:33:38
今早,库克画下另一张大饼
2025-06-10 08:42:25
苹果发布论文坚称 AI 训练符合道德原则,且尊重出版商权益
2025-07-22 00:23:59
郭明錤:苹果AI表现或令投资人失望 恐影响AR眼镜
2025-06-10 09:45:28
创新力受质疑!业内人士:苹果失去乔布斯的隐患 在AI时代暴露无遗
2025-07-14 11:20:21
Meta到处“挖墙脚”,苹果痛失AI王牌
2025-07-08 23:55:29
苹果一个计划中的“小升级”,谷歌市值一夜蒸发万亿
2025-05-08 18:35:23
苹果正在招聘团队:自研AI搜索平台
2025-08-05 17:18:03
苹果准备放出AI底牌:向开发者开放大模型权限
2025-05-21 07:55:27
苹果后院起火
2025-06-21 21:16:47
24小时热文
更多
扫一扫体验小程序