以下是原文 正文:百川智能于1月26日宣布上线开源全模态模型Baichuan-Omni-1.5。该模型支持文本、图像、音频和视频的全模态理解,并具备文本和音频的双模态生成能力。据官方称,Baichuan-Omni-1.5在视觉、语音及多模态流式处理等方面优于GPT-4o mini,尤其在多模态医疗应用领域表现突出。模型采用端到端解决方案,支持多语言对话和音视频实时交互。在视频理解能力方面,通过多个关键环节优化,性能大幅超越GPT-4o mini。模型结构上,支持多种模态输入并通过Text Tokenizer和Audio Decoder同时生成文本和音频。百川智能构建了包含3.4亿条高质量图片/视频-文本数据和近100万小时音频数据的数据库。开源地址:
原文链接
本文链接:https://kx.umi6.com/article/12201.html
转载请注明文章出处
相关推荐
换一换
微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GPT-4o Mini
2025-01-09 14:59:03
百川智能上线开源全模态模型 Omni-1.5,号称多项能力超越 GPT-4o mini
2025-01-26 16:14:16
OpenAI发布迷你AI模型GPT-4o mini
2024-07-18 23:50:44
价格骤降96%~97%,OpenAI“杀入”小模型,GPT-4o mini功能更强、成本更低
2024-07-19 17:28:53
OpenAI突然发布GPT-4o mini ,GPT-3.5成为历史
2024-07-19 11:03:35
OpenAI 推出 AI 模型 GPT-4o mini,号称功能最强、成本效益最高的小模型
2024-07-18 23:40:41
发布 GPT-4o Mini 后,OpenAI CEO 阿尔特曼称产品命名方式“需要改变”
2024-07-22 19:17:27
OpenAI推出“小”模型GPT-4o Mini,开始卷性价比了?
2024-07-19 12:54:48
OpenAI发布迷你AI模型GPT-4o mini;抖音将投亿级资源补贴微短剧|AI daily早新闻
2024-07-19 13:15:05
GPT-4o mini凭什么登顶竞技场?OpenAI刷分秘诀被扒,原来奥特曼早有暗示
2024-07-29 16:56:31
OpenAI凌晨突发“最具性价比”模型GPT-4o mini
2024-07-19 10:53:23
GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费
2024-07-24 16:09:17
GPT-4o mini团队揭秘:9人团华人面孔过半,清华北大同济校友在列
2024-07-19 14:26:09
702 文章
402255 浏览
24小时热文
更多
-
2025-12-08 19:45:13 -
2025-12-08 19:43:05 -
2025-12-08 18:41:52