AI音频 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

亚马逊测试 AI 音频摘要功能：“AI 购物专家”语音讲解产品要点

亚马逊于本周三宣布，正在测试由AI生成的音频商品摘要功能，名为“AI购物专家”，可通过语音介绍产品特点、用户评价及网络信息，帮助消费者节省购物时间。用户可在亚马逊购物App中点击“听要点”按钮收听。该功能先面向部分美国用户及特定产品开放，未来几个月计划扩大范围。亚马逊利用大型语言模型从用户评价和网络信息中提取内容并生成音频。这是亚马逊AI驱动购物功能的一部分，其他功能包括Rufus购物助手和“兴趣”功能。IT之家5月22日报道。

原文链接

幻彩逻辑RainbowLogic

05-22 16:33:00

AI音频摘要

亚马逊

购物功能

分享至

打开微信扫一扫

内容投诉

生成图片

速度最快：Stable Audio Open Small 端侧音频模型登场，手机上 8 秒内 AI 生成 11 秒音频

5月14日，AI初创公司Stability AI推出Stable Audio Open Small，号称是目前市场上速度最快的端侧音频生成AI模型，可在智能手机上运行。相比Suno和Udio等应用，该模型无需依赖云端，能在8秒内生成最长11秒的音频片段，适合快速制作音效。Stability AI与Arm合作优化，使其能在智能手机离线运行。训练数据来自Free Music Archive和Freesound免版税库，避免了版权争议。不过，该模型目前仅支持英文提示，且生成的音乐类型表现差异较大，尤其缺乏逼真歌声或高质量歌曲。使用条款规定，年收入低于100万美元的用户可免费使用，超出者需购买企业许可证。

原文链接

DreamCoder

05-16 14:19:16

AI音频模型

Stable Audio Open Small

智能手机

分享至

打开微信扫一扫

内容投诉

生成图片

华金证券：眼镜是端侧AI最佳载体

华金证券指出，眼镜将成为端侧AI的最佳载体。随着智能可穿戴设备需求的增长及生成式人工智能大模型的兴起，AI音频眼镜正逐步拓展更广阔的市场。当前，在AR眼镜用户群体尚不明确的情况下，智能音频眼镜通过替代传统耳机功能，以眼镜作为载体（包括矫正视力和装饰用途），结合AI技术提升用户体验，有望开创音频设备的新领域。

原文链接

虚拟织梦者

12-12 11:54:42

AI音频眼镜

华金证券

智能可穿戴设备

分享至

打开微信扫一扫

内容投诉

生成图片

雷军AI语音屡禁不绝，谁该为此负责？

近期，AI语音技术引发广泛关注，特别是在雷军的AI语音事件中，其声音被克隆并用于生成接近真人讲话音质的AI音频，引发舆论热潮。这些音频内容在抖音、快手和B站等互联网平台传播，部分包含了骂人、恶搞小米产品的语音。这一现象不仅挑战了公众人物的隐私权，也引发了关于AI音频技术责任归属的讨论。 AI音频制...

原文链接

智慧棱镜

10-15 18:24:20

AI音频应用与社区责任

公众人物声音克隆

雷军AI语音

分享至

打开微信扫一扫

内容投诉

生成图片

小米音频眼睛团队打造！界环AI音频眼镜发布：699元起

界环AI音频眼镜于8月8日由小米音频眼睛团队推出，售价仅需699元起。这款眼镜是北京蜂巢世纪科技有限公司的最新力作，其设计理念延续了MIJIA智能音频眼镜的创新，将扬声器巧妙地隐藏在镜腿中，实现眼镜与蓝牙耳机的完美融合。眼镜提供8款框架、共14种颜色选择，包括经典板材与精工金属系列，支持快拆设计以方...

原文链接

跨界思维

08-08 18:04:48

小米音频眼睛团队

界环AI音频眼镜

订阅付费模式

分享至

打开微信扫一扫

内容投诉

生成图片

AI音频“扛把子”刚上谷歌V2A，第一个视频+音频全自动AI工具，完全开源免费

谷歌DeepMind凌晨发布全新AI工具V2A，可根据画面内容或提示词为视频自动配音，但非公开。紧接着，ElevenLabs推出首个全自动视频+音频AI工具，基于文字到音频模型，提供Demo应用，成为目前市场上唯一开源免费的视频配音解决方案。ElevenLabs的AI能生成环境声、人声、音乐和音效，但音轨选择有限。尽管存在节奏和动态画面理解上的不足，这款工具已在影视领域展现出潜力。ElevenLabs由前Google和Palantir员工创立，近期获得8000万美元融资，显示出AI音频生成市场的蓬勃发展。随着技术进步，AI音频生成将更加精细，但也引发深度伪造技术的监管挑战。

原文链接