1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
视频理解新标杆,快手多模态推理模型开源:128k上下文+0.1秒级视频定位+跨模态推理
标题:快手开源多模态推理模型Keye-VL 1.5:视频理解新标杆 快手开源了新一代多模态推理模型Keye-VL 1.5,具备128k超长上下文窗口、0.1秒级视频定位能力及跨模态推理功能。相比此前版本,新模型在时序定位和跨模态推理上显著提升,并创新性提出Slow-Fast双路编码机制,在性能与...
阿达旻
09-05 22:26:24
多模态模型
视频理解
跨模态推理
分享至
打开微信扫一扫
内容投诉
生成图片
多模态通用感知能力超越 GPT-5,上海 AI 实验室开源书生・万象 3.5 大模型
9月3日,上海AI实验室开源多模态大模型书生・万象3.5(InternVL3.5),参数覆盖10亿至2410亿,适用于多种场景。旗舰模型InternVL3.5-241B-A28B在多学科推理基准MMMU中获77.7分,超越GPT-5的多模态感知能力,并领跑开源文本能力。相比上一代,新版本在GUI交互、具身空间感知和矢量图形生成等任务显著提升。其GUI交互性能达92.9分,Windows自动化操作领先Claude-3.7-Sonnet;具身智能体测试中路径规划能力超Gemini-2.5-Pro;矢量图形生成刷新开源纪录。此外,InternVL3.5支持跨平台操作,具备复杂场景泛化能力,助力机器人高效完成物理交互任务。目前全系列下载量突破2300万次,相关代码与模型已开源。
电子诗篇
09-03 21:51:48
InternVL3.5
上海AI实验室
多模态大模型
分享至
打开微信扫一扫
内容投诉
生成图片
上海AI实验室开源通用多模态大模型书生·万象3.5
9月3日,上海AI实验室宣布开源通用多模态大模型书生·万象3.5(InternVL3.5)。本次开源涵盖9种尺寸模型,参数量从10亿到2410亿不等。旗舰模型InternVL3.5-241B-A28B在多学科推理基准MMMU中取得77.7分,为开源模型最高分,其多模态感知能力超越GPT-5,文本能力领先主流开源多模态模型。相比InternVL3.0,新版本在GUI智能体、具身空间感知、矢量图像理解与生成等任务上显著提升。
梦境编程师
09-03 20:52:29
上海AI实验室
书生·万象3.5
多模态大模型
分享至
打开微信扫一扫
内容投诉
生成图片
3D打印火出圈了?一众网友秀“成果” 幕后推手竟是这款AI模型
2025年9月1日,朋友圈和社交平台被大量“3D打印手办”图片刷屏,这些图片实际由谷歌推出的AI模型Nano-banana生成。该模型自8月26日上线后,凭借图像生成与编辑能力迅速出圈,在海外AI排行平台LMArena中以1362分位列第一。Nano-banana可将人物或动物图片转化为“手办”样式,并支持多图融合、风格迁移等功能,展现跨图一致性与常识推理能力。目前,Adobe等多家海外平台已集成该模型,华福证券认为其代表多模态模型的重大突破。同日,A股3D打印概念股震荡拉升,海正生材等多股涨停。机构指出,多模态模型商业化潜力巨大,算力与应用领域将迎来投资机遇。
幻彩逻辑RainbowLogic
09-01 13:19:49
3D打印
nano-banana
多模态模型
分享至
打开微信扫一扫
内容投诉
生成图片
“月球科学多模态专业大模型V2.0”发布
2025年8月29日,在中国国际大数据产业博览会期间,中国科学院地球化学研究所发布了“月球科学多模态专业大模型V2.0”。这一嵌入式专业大模型为“数字月球”云平台提供了智能化支持,赋予其高效运转能力。按计划,“数字月球”云平台将于2027年建成,并面向全球开放共享。这一成果标志着我国在月球科学研究和数字化领域迈出了重要一步。(新华社)
WisdomTrail
08-30 16:55:29
多模态专业大模型
数字月球
月球科学
分享至
打开微信扫一扫
内容投诉
生成图片
中国科学院“月球科学多模态专业大模型 V2.0”发布,提升月球研究效率
8月30日,中国科学院地球化学研究所在2025中国国际大数据产业博览会上发布“月球科学多模态专业大模型 V2.0”。该模型为“数字月球”云平台提供核心智能支持,大幅提升月球地质研究效率。针对月球表面直径1公里以上撞击坑超100万个的识别难题,AI模型可自动分析撞击坑形态、尺寸及形成年代,并生成完整描述。研发团队构建了含8700个撞击坑和7272个月球构造的标注数据集,模型在撞击坑分类与识别任务中准确率达88%-93%。“数字月球”云平台预计2027年建成并向全球开放,助力月球科学研究。
阿达旻
08-30 16:54:23
多模态专业大模型
数字月球
月球科学
分享至
打开微信扫一扫
内容投诉
生成图片
SuperCLUE多模态视觉评测榜:文心4.5 Turbo总分并列国内第一
8月28日,SuperCLUE-VLM多模态视觉语言模型评测榜单发布,百度ERNIE-4.5-Turbo-VL以66.47分并列国内第一,仅次于Gemini-2.5-Pro和GPT-5(high)。本次评测覆盖15款国内外模型,围绕基础认知、视觉推理和应用三大维度展开,全面评估真实场景任务能力。分析指出,文心大模型在多模态领域表现突出,尤其在视觉推理与应用等高阶任务上进步显著,展现了中国在该领域的竞争潜力。此前,百度于6月30日开源文心4.5系列模型,其跨模态能力支持超100种语言交互,覆盖文档处理、视频管理等核心场景。依托全栈自研体系,飞桨文心已服务67万家企业,开发者超2185万。
量子思考者
08-28 21:28:42
ERNIE-4.5-Turbo-VL
SuperCLUE-VLM
多模态大模型
分享至
打开微信扫一扫
内容投诉
生成图片
行业首个:8B 参数面壁小钢炮 MiniCPM-V 4.5 开源,号称“最强端侧多模态模型”
8月26日,面壁智能宣布开源8B参数的MiniCPM-V 4.5多模态模型,称其为“最强端侧多模态模型”。该模型在视频理解、图片识别、复杂文档解析等任务中表现卓越,尤其具备行业首个高刷视频理解能力,支持每秒处理更多帧数,大幅超越Qwen2.5-VL 72B等模型。MiniCPM-V 4.5通过3D-Resampler技术实现96倍视觉压缩率,显著提升动态画面理解精度。此外,其在MotionBench、OpenCompass等多项榜单中达到同级SOTA水平,并兼顾性能与响应速度,提供常规模式和深度思考模式。模型已开源,可通过Github、Hugging Face及ModelScope获取。
智慧棱镜
08-28 10:15:37
MiniCPM-V 4.5
多模态模型
高刷视频理解
分享至
打开微信扫一扫
内容投诉
生成图片
多模态新旗舰MiniCPM-V 4.5:8B 性能超越 72B,高刷视频理解又准又快
2025年8月27日,面壁智能正式开源8B参数的MiniCPM-V 4.5多模态旗舰模型。该模型是行业首个具备“高刷”视频理解能力的多模态模型,在性能与效率上实现越级领先,超越Qwen2.5-VL 72B模型。MiniCPM-V 4.5最大支持6倍视频帧数量输入,达到96倍视觉压缩率,显著提升动态画面理解精度。在图片、长视频、OCR及文档解析等任务中均达SOTA水平,并支持短思考与长思考混合推理模式,适用于端侧设备。模型已开源,可通过GitHub、Hugging Face和ModelScope获取。
电子诗篇
08-27 12:03:30
多模态模型
端侧推理
高刷视频理解
分享至
打开微信扫一扫
内容投诉
生成图片
当虹科技上半年亏损收窄 研发投入下降
2025年8月22日晚间,当虹科技发布半年报显示,上半年营收1.33亿元,同比增长12.70%;归母净亏损收窄至615.24万元,同比减亏3562.64万元。公司AI产品及多模态大模型应用落地,传媒文化与车载智能座舱业务显著增长。毛利率提升8.83个百分点,减值损失减少766.48万元。第二季度实现盈利,归母净利润573.70万元。研发投入下降30.46%,占比营收31.92%。公司累计申请发明专利552项,授权208项,持续推动AI与超高清、5G技术融合,视频应用向多行业延伸。
AI创想团
08-23 08:59:00
多模态大模型
当虹科技
研发投入
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序