11月14日,“讯飞开放平台”宣布讯飞星火多模态交互大模型正式上线。该模型实现了从单一语音交互向音视频流实时多模交互的拓展,新增了“多模态、超拟人和个性化”功能,集成了语音、视觉、数字人交互于一体,支持一键调用。该模型首次应用超拟人数字人技术,数字人的动作、表情能精准匹配语音内容,实现跨模态语义一致性,使情感表达更连贯。同时,该模型支持超拟人极速交互,采用统一神经网络实现语音到语音的端到端建模,能敏锐感知情绪变化并自由调整声音节奏、大小及人设。此外,它还能实现多模态视觉交互,能够理解具体背景场景,通过语音、手势、行为、情绪等综合判断作出回复。用户可通过数字人进行自然语音对话,数字人能识别摄像头中的内容,如物品品牌、品类等。
原文链接
本文链接:https://kx.umi6.com/article/8743.html
转载请注明文章出处
相关推荐
.png)
换一换
AI数字人,告别“印钞机”年代
2025-04-02 15:31:00
为什么一个弹幕,就能让主播喵一百声?
2025-06-24 10:15:35
零一万物以“Infra+模型+应用”三体布局 ToB:以数字人、AI Infra 解决方案智赋企业数智化增长
2024-11-07 10:21:59
京东布局具身智能等前沿科技,4月将上线AI数字人“千人千面”
2025-03-30 11:30:21
安卓版 Perplexity Assistant 登场:AI 多模态交互,“看”懂你的世界
2025-01-24 11:40:29
百度新一代数字人技术 NOVA 预计 10 月开放,曾支撑罗永浩数字人直播间
2025-07-26 12:39:25
京东:数字人带货水平超 80% 真人主播
2025-05-22 17:33:44
AI幻觉成WAIC首个关键词,Hinton敲响警钟,讯飞星火治理新突破
2025-07-28 15:14:56
魔珐科技CEO柴金祥:3D视频领域将迎来内容“大爆炸”
2025-01-15 15:37:47
AIGC独角兽硅基智能完成数亿元D轮融资,由嘉兴高新区产业基金投资
2025-07-09 14:08:36
不用睡觉的AI主播,日赚上万?
2024-09-10 21:10:49
斗兽场中数字人:技术能掌握流量暴力吗?
2024-06-25 21:06:26
数字人狂奔600天,还有四大槛
2024-08-27 10:56:46
480 文章
162380 浏览
24小时热文
更多

-
2025-09-07 21:49:50
-
2025-09-07 20:50:36
-
2025-09-07 20:49:25