AI大模型看手相!图片视频加持深度思考,阿里QVQ-Max“神了神了”
金磊 | 发自 凹非寺
量子位 | 公众号 QbitAI
阿里推出一款有趣的大模型——QVQ-Max,首款视觉推理模型,可对任意图像或视频进行深度思考。
趣味手相分析
上传手掌图片并点击“Thinking”,QVQ-Max能解读心线、头线、生命线及戒指象征意义,展现其娱乐性。
多图推理
提供多张图片,QVQ-Max能分析风景关联,如识别两张西湖图片分别对应春夏与冬景。
数学推理
仅需上传图片,QVQ-Max即可破解数字规律,得出正确答案,例如10或2。
视频字幕生成
手绘视频配字幕任务同样完成,显示其在视觉与文字结合上的能力。
网友试用时,虽偶有失误(如乔巴辨认不准),但仍热情高涨。同时,对吉卜力风格的兴趣也被激发。
实测体验
测试显示,QVQ-Max擅长解析复杂图表、日常照片,甚至几何题图形,还可推测视频情节发展。此外,它能设计插画、生成短视频脚本,甚至创作角色扮演内容。
技术亮点
尽管未公布论文,团队称其在MathVision基准测试中表现优异,通过调整思考长度提升准确率。QVQ-Max具备强解析、分析与推理能力,且支持免费体验。
体验地址:https://chat.qwen.ai
参考链接:
[1] https://qwenlm.github.io/zh/blog/qvq-max-preview/
[2] https://x.com/Alibaba_Qwen/status/1905342260100956210
原文链接
本文链接:https://kx.umi6.com/article/16323.html
转载请注明文章出处
相关推荐
换一换
国泰君安首席信息官俞枫:AI大模型驱动证券行业步入“智能认知”时代
2025-03-11 16:42:03
从「造砖」到「盖楼」,谁在重新定义AI大模型
2025-06-23 18:27:05
K时评:DeepSeek R2,翘首以盼
2025-08-19 21:06:04
小米集团创始人雷军:AI大模型是智能网联汽车的未来趋势
2025-10-16 18:00:06
杭州六小龙之一启动IPO,卖空间设计软件
2025-08-26 11:41:23
面壁智能获新一轮数亿元融资,贵州茅台酒旗下基金、国中资本等出资
2025-05-21 10:03:05
上海:探索AI大模型助力科研范式创新 建立算力设施的开放和优惠使用机制
2025-05-22 14:36:35
刚刚,GPT-5正式发布,奥特曼:这是全球最好的模型
2025-08-08 02:00:49
我国首部 AI 大模型系列国家标准实施,明确性能、安全与服务能力要求
2025-12-26 18:57:02
搜狗输入法,居然还在更新??
2026-01-28 09:03:40
豆包斗元宝,开始拼社交
2025-04-22 21:30:31
中国有了自主研发的高性能芯片
2025-07-09 12:06:27
中贝通信入股AI大模型公司阶跃星辰
2026-02-26 14:04:47
722 文章
562388 浏览
24小时热文
更多
-
2026-04-24 16:22:09 -
2026-04-24 16:21:03 -
2026-04-24 16:19:57