
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
6月25日,AI语音公司ElevenLabs推出独立移动应用,支持iOS和Android平台。用户可通过该应用输入文本并选择语音模型生成音频,免费用户享有约10分钟的文本转语音额度。应用接入最新v3 alpha模型,支持通过标签控制语音情感表达。此前,用户仅能通过网页版使用该服务。此次发布是ElevenLabs在消费级应用领域的进一步布局,未来计划增加语音转文本及对话式AI功能,并整合基于MCP技术的体验。
原文链接
2月25日,ElevenLabs发布ElevenReader Publishing平台,利用AI语音技术帮助作者轻松制作有声书。该平台已与多位知名人士合作,现向所有人开放。尽管有声书市场需求大,但因制作慢、成本高,目前仅5%书籍有声化。ElevenReader平台提供语音定制、节奏控制和多角色配音等功能。平台目前仅支持英语,未来将扩展至31种语言。每位用户收听超11分钟,作者可获1.10美元收益,此功能目前仅限美国用户。
原文链接
标题:海螺语音与ElevenLabs较量的实力
试想职场中遇到香港客户,需在线解释延误情况。你听到的粤语、英语混用片段,其实是AI配音,使用的是海螺语音工具。今年1月,MiniMax推出升级的T2A-01语音模型,支持17种语言及上百种音色。
测试中,海螺语音在绕口令“施氏食狮史”中表现优异,字词清晰,音调自然。相比之下,ChatTTS字词粘连,ElevenLabs则有“呱呱叫”的问题。海螺语音不仅音质稳定,还支持多种语言及情绪控制。
在多语言合成能力上,海螺语音在相似度、错误率等方面领先ElevenLabs。它能用不同语气和情绪流畅表达九种语言。此外,海螺语音还能精确控制情绪,如从害怕到高兴的转变,满足多样化需求。
海螺语音还提供了超过300种音色选择,用户可自定义调节。这使得海螺语音不仅适用于日常对话,还适用于影视配音等专业场景。
原文链接
根据FlexOS收集的Similarweb网站流量数据,在5月份全球工作场所中,生成式人工智能工具的应用呈现出显著增长趋势。ChatGPT作为全球最高效的十大办公AI工具之首,其使用量激增74%,从4月份的18亿次增长至31亿次。紧随其后的是谷歌Gemini和Anthropic的Claude。ElevenLabs、Poe、Claude、GitHubCopilot、Suno、PerplexityAI、QuillBot、GoogleGemini和CanvaAISuite分别位列第二至第十位。这些AI工具涵盖了从语音生成、问答互动、编程辅助到音乐创作、写作编辑等多个领域,极大地提高了工作效率。尤其值得注意的是,ChatGPT不仅在美国广受欢迎,印度、印度尼西亚和巴西也显示出较高的使用率。这表明生成式AI技术在全球范围内得到了广泛认可和应用,成为提升生产力的重要工具。
原文链接
7月19日,ElevenLabs发布Turbo 2.5文本转语音AI模型,支持32种语言,包括普通话,旨在为全球80%地区提供高质量、低延迟的AI对话。新增越南语、匈牙利语和挪威语,印地语等27种语言响应速度提升高达3倍,英语提升25%。该模型采用先进技术和低延迟架构,实现快速且自然的合成语音,响应时间少于400毫秒。总部位于伦敦的ElevenLabs计划年内团队规模扩大至100人,致力于透明度与创新,如AI Speech Classifier及电影配音工具的研发。
原文链接
谷歌DeepMind凌晨发布全新AI工具V2A,可根据画面内容或提示词为视频自动配音,但非公开。紧接着,ElevenLabs推出首个全自动视频+音频AI工具,基于文字到音频模型,提供Demo应用,成为目前市场上唯一开源免费的视频配音解决方案。ElevenLabs的AI能生成环境声、人声、音乐和音效,但音轨选择有限。尽管存在节奏和动态画面理解上的不足,这款工具已在影视领域展现出潜力。ElevenLabs由前Google和Palantir员工创立,近期获得8000万美元融资,显示出AI音频生成市场的蓬勃发展。随着技术进步,AI音频生成将更加精细,但也引发深度伪造技术的监管挑战。
原文链接
6月2日,ElevenLabs 推出全新 AI 工具 "Sound Effects",专为播客、电影和游戏创作音效,通过与 Shutterstock 合作利用海量音频资源进行训练。该工具提供免费和付费版本,付费用户可商用,免费用户需标注来源。区别在于,免费用户字符限制每月10,000,生成音效消耗字符。相比市场上的高价音效素材库,"Sound Effects"主打快速、经济且音效丰富。同时,Stability AI 和 Meta 也在音效生成领域有所动作。
原文链接
加载更多

暂无内容