1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

AI大模型看手相!图片视频加持深度思考,阿里QVQ-Max“神了神了”

金磊 | 发自 凹非寺
量子位 | 公众号 QbitAI

阿里推出一款有趣的大模型——QVQ-Max,首款视觉推理模型,可对任意图像或视频进行深度思考。

趣味手相分析
上传手掌图片并点击“Thinking”,QVQ-Max能解读心线、头线、生命线及戒指象征意义,展现其娱乐性。

多图推理
提供多张图片,QVQ-Max能分析风景关联,如识别两张西湖图片分别对应春夏与冬景。

数学推理
仅需上传图片,QVQ-Max即可破解数字规律,得出正确答案,例如10或2。

视频字幕生成
手绘视频配字幕任务同样完成,显示其在视觉与文字结合上的能力。

网友试用时,虽偶有失误(如乔巴辨认不准),但仍热情高涨。同时,对吉卜力风格的兴趣也被激发。

实测体验
测试显示,QVQ-Max擅长解析复杂图表、日常照片,甚至几何题图形,还可推测视频情节发展。此外,它能设计插画、生成短视频脚本,甚至创作角色扮演内容。

技术亮点
尽管未公布论文,团队称其在MathVision基准测试中表现优异,通过调整思考长度提升准确率。QVQ-Max具备强解析、分析与推理能力,且支持免费体验。

体验地址:https://chat.qwen.ai
参考链接:
[1] https://qwenlm.github.io/zh/blog/qvq-max-preview/
[2] https://x.com/Alibaba_Qwen/status/1905342260100956210

原文链接
本文链接:https://kx.umi6.com/article/16323.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里通义千问推出视觉推理模型 QVQ-Max:可分析、推理图片和视频内容
2025-03-28 11:43:06
干货满满!“共筑金融新生态:AI大模型落地应用与实践”论坛成功举办
2025-02-24 20:35:31
多家金融与资管机构发力AI大模型运用,核心场景集中于投研支持
2025-03-13 14:25:27
国产 AI 大模型加速迭代,厂商迈向开源、集聚化
2025-02-23 22:06:26
vivo 蓝心语言大模型升级,蓝心小 V 支持深度思考、无唤醒词交互
2025-10-11 10:02:45
当虹科技发布BlackEye 2.0 多模态空间大模型 与阿里云合作打造自主可控AI大模型解决方案
2025-09-19 17:21:37
上海市国资委召开市属金融机构AI大模型应用研讨会
2025-04-02 14:29:25
字节跳动豆包上线「深度思考」推理模式,覆盖问答、搜索、写作和阅读场景
2025-03-07 09:52:46
别让AI替你说出那句“我觉得”
2025-06-05 14:54:38
AI大模型引爆银发经济:12万亿市场重构进行时
2025-03-21 11:19:20
Anthropic天价赔款?大模型“盗版”的100000种花样
2025-08-15 10:14:50
我国水利标准 AI 大模型正式发布,采用海量知识库 + DeepSeek / Qwen 双模型
2025-06-03 10:52:19
绝味食品:与腾讯智慧零售联合发布零售连锁AI大模型
2025-04-15 13:31:10
24小时热文
更多
扫一扫体验小程序