11月14日,“讯飞开放平台”宣布讯飞星火多模态交互大模型正式上线。该模型实现了从单一语音交互向音视频流实时多模交互的拓展,新增了“多模态、超拟人和个性化”功能,集成了语音、视觉、数字人交互于一体,支持一键调用。该模型首次应用超拟人数字人技术,数字人的动作、表情能精准匹配语音内容,实现跨模态语义一致性,使情感表达更连贯。同时,该模型支持超拟人极速交互,采用统一神经网络实现语音到语音的端到端建模,能敏锐感知情绪变化并自由调整声音节奏、大小及人设。此外,它还能实现多模态视觉交互,能够理解具体背景场景,通过语音、手势、行为、情绪等综合判断作出回复。用户可通过数字人进行自然语音对话,数字人能识别摄像头中的内容,如物品品牌、品类等。
原文链接
本文链接:https://kx.umi6.com/article/8743.html
转载请注明文章出处
相关推荐
换一换
百度新一代数字人技术 NOVA 预计 10 月开放,曾支撑罗永浩数字人直播间
2025-07-26 12:39:25
松下集团以 AI“复活”松下幸之助,借数字人传承创办者经营理念
2024-11-29 16:58:04
魔珐科技CEO柴金祥:3D视频领域将迎来内容“大爆炸”
2025-01-15 15:37:47
京东:1.4万个智能体上岗“赛跑” 数字人带货成绩超80%真人主播
2025-05-22 17:35:51
英伟达H20不让用?全国产算力推理模型升级,4张华为卡即可部署
2025-04-22 15:20:45
百度发布高说服力数字人,可在电商直播领域带来超越真人体验
2025-04-25 12:08:43
阿里云发布 AI 硬件多模态交互开发套件:集成通义大模型,适配 30 多款终端芯片
2026-01-08 13:12:06
独家 | 对话百度副总裁平晓黎:深度复盘数字人业务逻辑
2025-08-01 09:12:15
国内AI数字人“头牌” 硅基智能冲刺港股IPO
2025-11-01 22:52:11
AI幻觉成WAIC首个关键词,Hinton敲响警钟,讯飞星火治理新突破
2025-07-28 15:14:56
安卓版 Perplexity Assistant 登场:AI 多模态交互,“看”懂你的世界
2025-01-24 11:40:29
真·罗永浩直播干不过假·罗永浩?网友:不是老罗在演AI吧?
2025-06-18 16:38:27
零一万物以“Infra+模型+应用”三体布局 ToB:以数字人、AI Infra 解决方案智赋企业数智化增长
2024-11-07 10:21:59
650 文章
452669 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18