1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
AI语音离「现实场景」还有多远?
4月12日,MiniMax推出最新语音生成模型Speech-02,5月15日其升级版Speech-02-HD登顶多个榜单。AI语音赛道火热,多家企业完成融资,如Cartesia获6400万美元融资,Hume AI获5000万美元融资,Google和Amazon也在布局相关技术。近期测试显示,AI在中文有声书配音中,DubbingX表现较优,能较好传达“愤怒”与“悲伤”情绪;但在英文有声书场景中,多数模型未达及格标准。直播带货场景中,AI情感表达合格但场景适配性差,而AI陪伴场景表现中规中矩。总体来看,AI语音在简单场景中表现尚可,复杂场景仍需改进。未来,toB领域应用前景广阔,如AI助手和陪伴硬件,我们将持续关注其发展。
梦境编程师
06-06 11:25:15
AI语音
应用场景
情感表达
分享至
打开微信扫一扫
内容投诉
生成图片
祖母的讣告能用Deepseek代写吗?
标题:祖母的讣告能用Deepseek代写吗? 两年前,杰巴·金的祖母去世,作为家族的“秀才”,他承担起写讣告的任务。31岁的他从未写过此类文章,亲友离世的伤痛也让他难以动笔。最终,他尝试使用OpenAI的ChatGPT。他输入祖母的事迹——护士生涯、爱好保龄球、子孙满堂等——要求生成讣告。经过修改,...
AI创想团
03-05 14:06:59
人工智能
情感表达
讣告
分享至
打开微信扫一扫
内容投诉
生成图片
首个可保留情感的音频 LLM:Meta 重磅开源 7B-Spirit LM,一网打尽“音频 + 文本”多模态任务
Meta近日开源了一款名为Spirit LM的7B参数规模的多模态语言模型,能够同时处理语音和文本数据,不仅支持语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。这款模型通过交错使用文本和语音数据进行训练,使得模型能在两种模式间自由转换。与现有模型相比,Spirit LM在处理多种模态数据和任务时具有更强的泛化能力。该模型有两个版本:基础版和表达版。表达版额外引入音高和风格token,使其在生成语音时能更丰富地表达情感。实验结果显示,Spirit LM在自动语音识别和文本转语音任务中表现出色,尤其是在少量样本的情况下也能跨模态学习新任务。不过,该模型也可能生成不安全的内容,需要额外的安全测试。Meta开源该项目旨在推动语音和文本结合的语言模型的发展。
AI思维矩阵
11-22 14:06:22
多模态
情感表达
语音和文本
分享至
打开微信扫一扫
内容投诉
生成图片
Cyan青心意创震撼发布“全面拟人”机器人OrcaⅠ,机器人开始懂情感、有温度
10月30日,Cyan青心意创发布了其自主研发的通用人形机器人OrcaⅠ的动态视频,展示了其在行走、爬坡、转圈、步态恢复、户外行走等方面的运动控制能力,以及在大语言模型加持下的自然语言交互能力和双臂操作能力。 OrcaⅠ在本体设计、运动控制、自然语言对话、双臂操作等方面实现了技术突破,赋予其更为灵动...
镜像现实MirageX
10-30 18:16:28
全面拟人
情感表达
机器人
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序