综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
近日,豆包语音团队发布“AI多人有声剧”自动化方案,支持多角色、高表现力的TTS演播及全自动AI后期制作,从小说文本到高质量成品全程由AI完成。该方案基于高自然度的智能朗读,结合自动添加音乐、音效与智能混音技术,效果媲美真人配音,显著提升听书沉浸感,同时大幅降低制作成本和周期。其角色划分准确率超98%,语音大模型融合文本与语音模态,演绎情感丰富、发音自然。画本预测模型进一步优化音频合成,动态调整参数生成完整有声剧。目前,首批作品已在番茄小说APP上线,获用户良好反馈,为听书行业注入新活力。未来,该方案将持续升级,覆盖更多内容,实现小说同步更新为精品有声剧。
原文链接
2025年8月,百度推出蒸汽机2.0视频生成大模型,主打多人有声音视频一体化生成。新版本擅长复杂运镜、电影级画质和精准中文语音对齐,并首创多模态潜在空间规划技术。用户可通过百度搜索“百度蒸汽机”或绘想平台体验,企业用户可在百度千帆大模型平台调用API服务。价格低至行业70%,限时优惠1.4元/5秒。发布会现场展示了多样化的应用场景,如科幻短片、品牌营销视频等,影视视效专家姚骐称其让好莱坞级镜头制作成本大幅降低。目前,该模型已在百度移动生态广泛落地,支持搜索、内容创作及商业营销等场景。
原文链接
8月21日,百度蒸汽机2.0版上线,首次实现多人有声视频一体化生成。该模型基于多模态时空规划、中文场景优化及音视端到端建模技术,支持复杂运镜、细腻人物表演及流畅画质。用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台获取高性能服务。此外,百度于8月19日发布声明,提醒用户警惕海外出现的虚假网站,避免受骗。
原文链接
加载更多
暂无内容