
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:一句话生成播客,豆包·播客模型太逼真了!
家人们,又一款有趣的AI来了——火山引擎发布了豆包·播客模型!只需一句话,就能生成高质量的播客内容。无论是实时热点讲解、超长文本概括,还是开放式话题反应,豆包·播客模型都能轻松应对。
例如,根据“亚朵酒店致歉”生成的播客,AI展现出清晰的态度和专业性;...
原文链接
4月1日,中信建投指出,预训练大模型的边际收益因Scaling Law接近瓶颈,智能体(Agent)成为大模型厂商的新发力点。Agent技术历经三阶段演进:工作流+预训练模型、工作流+推理模型,再到端到端智能体+推理模型。第三代智能体代表如OpenAI Deep Research,展现出巨大潜力。得益于国产推理模型的支持,国产第三代智能体预计将在4月迎来集中发布,并展现强劲竞争力。
原文链接
3月6日,智平方宣布完成新一轮过亿元Pre A+轮融资,投资方包括敦鸿资产、云启资本和国投创盈等。智平方是国内最早探索端到端VLA技术路线的企业,2024年实现搭载端到端VLA具身大模型的智能机器人商业化。2025年初,智平方在两个月内迅速完成两轮数亿融资。本轮融资将用于加速端到端VLA模型迭代及推动具身智能机器人商业化。智平方自主研发的AI2R Brain具身大模型已部署于Alpha Bot系列机器人,最新产品Alpha Bot 1S融合了轮式设计和高自由度机械臂。智平方已签约多家国内外一线车企、高端制造企业及互联网巨头,并实现数千万级别收入。智平方创始人郭彦东博士曾任小鹏汽车和OPPO首席科学家,团队汇集了AI、机器人和智能终端领域的顶尖人才。
原文链接
Figure AI创始人Brett Adcock宣布,明日Figure将揭晓“公司历史上最重要的AI更新”,可能涉及人形机器人上的新突破。Figure已于2月14日向第二个商业客户交付了Figure-02人形机器人,并计划在未来30天内展示端到端工作能力。此前,Figure终止了与OpenAI的合作,认为集成大模型不是最佳方案,应专注于端到端AI模型。Figure正洽谈新一轮15亿美元融资,若成功,公司估值将达395亿美元,成为全球估值最高的十大未上市初创公司之一。
原文链接
理想汽车发布最新V13版本智能驾驶系统,实现“车位到车位”全程自主驾驶,包括自主过闸机和避让障碍物。该系统搭载2颗英伟达Orin X芯片,配备多摄像头和激光雷达,具备800万clips训练数据。理想V13系统通过端到端模型和VLM大模型结合,提供更高效的驾驶策略和AI可视化界面。这一技术进步使理想跻身智能驾驶领先阵营,加速了中国智能驾驶领域的竞争。
原文链接
微软宣布组建新AI部门,由Meta前高管Jay Parikh领导,目标是构建端到端AI应用开发生态。微软CEO纳德拉表示,新部门将与Mustafa Suleyman等高层紧密合作,推动公司在AI和云计算领域的战略。自OpenAI推出ChatGPT以来,AI成为技术热点。微软作为OpenAI的主要投资者,正独立开发与之竞争的产品。纳德拉强调跨部门合作的重要性,以提高创新速度。
原文链接
标题:大疆智驾王炸:32TOPS跑通端到端,纯视觉有路就能开
正文:
贾浩楠 发自 副驾寺智能车参考 | 公众号 AI4Auto
高阶智驾普及到10万级车的安卓时刻将在2025年Q1到来。A级小车宝骏云海车主将成为首批体验者,享受不分时段、不分地域的高阶智驾。
推动者是卓驭科技,背后是大疆自动驾驶业...
原文链接
12月14日,阶跃星辰宣布推出国内首个千亿参数端到端语音大模型“Step-1o”。与传统级联方案相比,Step-1o实现了语音理解和生成的一体化,提升了模型的智商和情商。该模型支持语音、文本等多种形式的输入和输出,能够快速反应并随时打断,还能深度理解和模仿音色、韵律、方言等声音特征。Step-1o具备自我学习和模仿能力,不仅能提供专业建议,还能提供高情绪价值的陪伴,并且具有强大的创作能力。近期,Step-1o将接入跃问App,为用户提供实时语音通话服务。
原文链接
10月,小鹏和特斯拉相继发布了AI汽车,引发行业热潮。小鹏汽车率先发布了新车型“小鹏P7+”,预售价20.98万元起,预计11月上市。特斯拉则发布了无人驾驶出租车Cybercab。这场竞争加速了国内车企对端到端自动驾驶技术的研发。蔚来、理想汽车、长城汽车、比亚迪等纷纷推出相关技术成果。然而,AI汽车的发展仍面临算力、数据、模型等方面的挑战。中国电动汽车百人会发布的研报指出,智能算力基础设施不足是主要制约因素。尽管如此,数据驱动的端到端智能驾驶技术正逐步成为趋势,有望提升自动驾驶的安全性和效率。未来,融合单车智能和车路云的“两端输入”式智能驾驶方案,或将成为应对技术挑战的有效途径。
原文链接
微软亚洲研究院前首席研究经理谭旭于8月加入大模型创业公司月之暗面,负责研发端到端语音模型。月之暗面自去年10月起便开始了多模态研究,目前已有约10人团队专注于视频模型的研发,以确保产品更具差异性,发布计划仍在推迟。谭旭曾在微软研究院担任首席研究经理,专攻生成式AI及语音、音频、视频内容生成领域,论文引用量过万,并担任NeurIPS等学术会议的审稿人。谭旭的加入旨在帮助月之暗面开发类似于OpenAI的GPT-4o的语音体验,该技术基于端到端语音技术,具有较低延时和实时互动的特点。相较传统的ASR(自动语音识别)+ LLM(大语言模型)+ TTS(语音合成)方案,端到端技术能显著缩短机器响应时间并支持随时打断,从而提升用户体验。此次人事变动发生在微软亚洲研究院和OpenAI推出创新语音技术之后,显示了当前语音技术领域的激烈竞争。
原文链接
加载更多

暂无内容