商汤最新发布的“日日新融合大模型交互版”(SenseNova-5o)展示了强大的AI交互能力。面对一张摆放真虾的照片,这款AI不仅能识别出虾,还猜测可能是高仿模型。在繁体书法作品前,它准确识别出内容为“宁静致远”,并解释了从右往左读的原因。
“新5o”在延迟和真实度方面表现出色,延迟低于2秒,能够模拟语气和情感。它还具备出色的记忆力,能记住超过五分钟的多模态交互信息。在“大家来找茬”游戏中,AI识别出多个不符合1980年代特征的物品。
此外,“新5o”能解答物理题目,准确解析答案,并识别复杂的神经网络架构。与GPT-4o的对话显示,“新5o”在延迟方面更具优势。
“新5o”采用国内首个原生融合多模态模型,将多种信息深度融合,提高理解和处理复杂任务的能力。在权威评测中,它在语言、推理和多模态处理方面均表现出色,位居前列。
原文链接
本文链接:https://kx.umi6.com/article/12070.html
转载请注明文章出处
相关推荐
换一换
超越GPT-4o!阿里发布最强开源多模态模型Qwen2-VL,支持实时视频对话
2024-08-30 15:15:58
比扩散模型快50倍!OpenAI发布多模态模型实时生成进展,作者还是清华校友,把休假总裁Greg都炸出来了
2024-10-24 14:09:29
独家丨前阿里通义视觉负责人薄列峰,已加入腾讯混元团队
2025-07-27 19:02:28
抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o
2025-10-14 12:13:47
谷歌正式发布 Gemma 3n 小钢炮模型:2GB 内存本地玩转 AI 多模态
2025-06-27 16:11:19
天工大模型 4.0 o1 版 / 4o 版上线,App 及网页可免费使用
2025-01-06 11:23:41
全新创作平台SkyReels来了!一张画布+对话框包办AI视频创作流程
2025-11-04 13:13:09
DeepSeek 深夜再放大招:7B 参数人人可用的视觉多模态模型 Janus-Pro-7B 开源
2025-01-28 01:38:40
行业首个:商汤发布并开源 NEO 原生多模态模型架构,实现视觉、语言深层统一
2025-12-02 23:39:14
Meta开源多模态模型——Llama 3.2
2024-10-09 11:34:43
上科大何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」
2026-01-16 15:56:29
多模态模型挑战北京杭州地铁图!o3成绩显著,但跟人类有差距
2025-06-07 13:49:19
DeepSeek的Janus-Pro表现如何?
2025-01-28 15:49:21
702 文章
500469 浏览
24小时热文
更多
-
2026-03-10 11:10:02 -
2026-03-10 11:09:29 -
2026-03-10 11:08:54