上海,2024年7月5日,在世界人工智能大会(WAIC 2024)期间,商汤科技发布了国内首个实时多模态流式交互模型“日日新5.5”。这款模型能进行跨模态识别,如声音、文本、图像和视频,实现所见即所得的AI交互,与GPT-4o相当。在演示中,"日日新5.5"展现了强大的识别及理解能力,包括识别胸卡信息、描述物品细节、解读文字图片、理解绘画表达等,且综合性能提升30%。商汤科技同时推出“大模型0元Go”计划,新注册用户可享受多项免费服务,助力企业快速接入和利用这一先进技术。
原文链接
本文链接:https://kx.umi6.com/article/2765.html
转载请注明文章出处
相关推荐
.png)
换一换
OpenAI回滚了最新版本的GPT-4o,因ChatGPT“过于谄媚”
2025-04-30 20:11:51
聚焦AI新浪潮 财联社实地探访3家标杆企业
2025-03-03 11:17:32
GPT-4o竟是「道德专家」?解答50道难题,比纽约大学教授更受欢迎
2024-07-06 01:29:48
419 文章
63858 浏览
24小时热文
更多

-
2025-07-20 17:06:49
-
2025-07-20 16:05:44
-
2025-07-20 16:05:36