声网首席运营官刘斌在MEET 2025智能未来大会上分享了RTE技术在AI Agent时代的应用价值。声网作为全球音视频技术龙头,平台单月音视频使用时长达到700亿分钟。声网与OpenAI及MiniMax合作,致力于打造国内首个Realtime API。
刘斌指出,多模态对话体验的关键在于延迟低于1.7秒和能否打断。AI Agent应用产品化落地需要端到端、全球任意地点、弱网环境、各种终端下的低时延支持。无论是语音还是视频,多模态交互的AI Agent应用离不开RTE能力的支持。
声网拥有遍布全球的SD-RTN网络,确保音视频传输在400毫秒内端到端到达。声网还在30多个平台和30000多终端机型上提供SDK支持,涵盖各种操作系统。此外,声网在弱网环境下也能保证效果,这得益于其多年的技术积累。
声网发现现有RTC技术栈和基础设施存在改进空间,大型模型将在各种场景下大规模参与人类语言对话,从云端扩展到终端,再到边缘。未来,RTE将成为生成式AI时代AI基础设施的关键组成部分。
原文链接
本文链接:https://kx.umi6.com/article/10809.html
转载请注明文章出处
相关推荐
.png)
换一换
声网刘斌:“Her”真正落地实现离不开RTE能力的支撑|MEET 2025
2024-12-26 22:42:44
AI Agent ,以公司为单位爆发
2024-11-14 18:24:24
声网CEO赵斌:大模型API成本已下降超90%,实时互动未来将成生成式AI关键方向
2024-10-28 15:54:17
425 文章
65741 浏览
24小时热文
更多

-
2025-07-19 15:54:36
-
2025-07-19 15:54:26
-
2025-07-19 14:57:21