
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年7月1日,机器人AI研究公司Genesis AI宣布获得1.05亿美元种子轮融资,由Eclipse和科斯拉风投领投,前谷歌CEO埃里克·施密特和法国科技富豪泽维尔·尼尔等参投。该公司由卡内基梅隆大学博士周衔与前Mistral科学家Théophile Gervet联合创立,致力于开发通用机器人模型,使其能自动执行复杂多变环境中的任务。为解决物理数据训练难题,Genesis AI采用合成数据方案,并凭借其Genesis生成式物理引擎引发关注。该引擎由多家机构及企业合作开发,可实现比现实世界快43万倍的模拟速度,在RTX4090单卡环境下仅需26秒即可训练适配真实机器人的策略。目前团队约20人,成员涵盖机器人技术、机器学习等领域专家。融资估值暂未披露,但具身智能赛道已有企业达到数十亿美元级别估值。
原文链接
4月14日,苹果公司在一篇博文中详细介绍了其AI隐私保护核心技术,包括差分隐私和合成数据的应用。差分隐私技术通过添加随机噪声保护用户隐私,例如生成Genmoji表情时,仅汇总高频指令而不记录个性化信息,并确保数据与设备ID完全分离。合成数据技术则解决了长文本处理问题,利用大语言模型生成虚拟邮件并提取特征向量,在本地匿名反馈后形成反映真实邮件分布的合成数据集。这些技术已在邮件摘要功能中验证效果,并将在iOS 18.5及后续更新中扩展至图像处理、记忆相册等功能。苹果强调,所有数据均去标识化处理且加密存储于本地,公司仅获取群体趋势报告。
原文链接
4月7日消息,谷歌联合卡内基梅隆大学和MultiOn的研究团队发现,合成数据可使大模型数学推理能力提升八倍。当前全球高质量文本训练标记约300万亿个,但随着大模型需求激增,预计2026年前将耗尽这些数据,合成数据成为关键替代方案。研究团队探索了正向数据(正确解题示例)与负向数据(错误解题步骤)两种类型。正向数据虽能提供解题参考,但可能导致模型过度依赖模式匹配而非深入理解。负向数据则通过直接偏好优化(DPO)方法帮助模型识别并修正错误,增强逻辑推理能力。DPO为每一步骤分配优势值,强调关键步骤价值。测试显示,结合正向和负向合成数据预训练后,DeepSeek-Math-7B和LLaMa2-7B等模型在GSM8K和MATH数据集上的数学推理性能显著提升八倍,展现了合成数据的巨大潜力。
原文链接
马斯克宣布Grok 3发布,其在多项测试中超越或媲美Gemini、DeepSeek和ChatGPT等对手。Grok 3接受了合成数据的训练,有助于逻辑一致性。当前AI范式正从‘以模型为中心’转向‘以数据为中心’。合成数据因其低成本、高质量及避免隐私侵犯的优势,被视为未来大模型训练的解决方案。市场分析指出,合成数据在AIGC时代展现出巨大潜力,被广泛应用于各行业。利亚德表示动作大模型助力智能体完成合成数据和推理等计算,星环科技则表示在研究和使用合成数据,并提供相应解决方案。
原文链接
马斯克在CES期间表示,现实世界可用于AI训练的资料去年已被耗尽。他认为AI产业能消耗的数据已达顶峰,补充数据的方法需转向合成数据。OpenAI前科学长Ilya Sutskever去年也有类似观点。微软、Meta、OpenAI及Anthropic等公司已在AI模型训练中广泛使用合成数据。Gartner预计2024年AI项目中60%数据为合成数据。例如,微软开源的AI模型‘Phi-4’和谷歌的‘Gemma’均采用合成数据训练。
原文链接
人工智能训练数据耗尽了怎么办?
近日,马斯克在社交平台X的直播对话中表示,AI训练数据已在去年耗尽:“我们基本用尽了所有人类知识进行AI训练。”
马斯克的观点与前OpenAI首席科学家Ilya Sutskever一致。Sutskever曾表示,AI行业已达到“数据峰值”,训练数据不足将迫使AI开发方...
原文链接
《科创板日报》报道,马斯克表示,现实世界中用于训练AI模型的数据已近乎耗尽,这一现象主要发生在去年。他指出,合成数据将是未来的解决之道,即让AI自行生成训练数据并通过自我评估持续优化。
原文链接
马斯克在与Stagwell董事会主席马克・佩恩的直播对话中表示,现实世界中用于训练AI模型的数据已接近耗尽,这一现象去年开始显现。他提出合成数据是未来的解决方案,即AI自己生成训练数据。Gartner预计到2024年,60%的人工智能和数据分析项目数据将通过合成方式生成。合成数据能降低成本,例如Writer公司的Palmyra X 004模型开发成本仅70万美元,而相似规模的OpenAI模型需460万美元。然而,合成数据也可能导致模型性能下降,输出结果缺乏创新性和偏颇性。
原文链接
标题:Claude 3.5 Opus未公开,实为内部训练工具
传闻反转,Claude 3.5 Opus并未训练失败,而是被Anthropic用于内部数据合成及强化学习奖励建模。Claude 3.5 Sonnet正是基于此训练而来。采用这种方法,推理成本未显著增加,但模型性能提升。
为何不发布?Ant...
原文链接
**摘要:**
11月26日,《科创板日报》报道了IDEA研究院创院理事长沈向洋的专访。沈向洋强调“AI For Science”是当前最紧迫的任务之一。作为华人顶尖计算机科学家,沈向洋曾领导微软研发出Al聊天机器人小冰,并在2019年离开微软后创立IDEA研究院,专注于人工智能和数字经济领域的研究与产业落地。在上周的IDEA2024大会上,沈向洋介绍了IDEA研究院在多个垂直大模型方面的突破,包括化学大模型、营销大模型等。
沈向洋指出,算力已成为AI发展的核心瓶颈,英伟达的H100芯片在算力竞争中占据优势。同时,合成数据成为AI发展的重要方向,蕴含巨大商业潜力。他还强调,低空经济的发展需建立设施网、航路网、空联网和服务网四张网,以保障安全、效率和成本。此外,沈向洋呼吁关注AI治理,确保AI发展能真正造福人类,实现科技与人文的和谐共生。
(摘要207字)
原文链接
加载更多

暂无内容