训练数据 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背训练大模型时，“记性差一点”反而可能更聪明。大语言模型容易复刻训练数据，为解决这一问题，马里兰大学、图宾根大学和马普所的研究团队提出了一种新方法——金鱼损失（Goldfish Loss）。金鱼损失的核心是让模型像金鱼一...

原文链接

蝶舞CyberSwirl

09-03 17:49:26

分享至

打开微信扫一扫

内容投诉

生成图片

数据“中毒”AI 还能靠谱吗？央视起底 AI 数据污染乱象

8月16日，央视报道了AI数据污染问题及其潜在风险。近年来，AI因训练数据中混入虚假或误导性信息，频繁杜撰内容、传播谣言，甚至引发社会舆论和经济损失。例如，宁波两起无关事件被AI错误关联，儿童手表回答问题时贬低中国文化等案例揭示了问题严重性。专家指出，数据污染分为人为篡改和不良信息未甄别两类，即使是0.001%的污染数据也会显著提高有害输出比例。此外，污染数据可能在金融、公共安全等领域引发判断失误。为防范风险，国家安全部门建议加强源头监管，采用可信数据源，构建数据治理框架，并通过自动化工具与人工审查结合清理受污染数据。

原文链接

AGI探路者

08-16 21:29:15

分享至

打开微信扫一扫

内容投诉

生成图片

曝GPT-4.5本周空降！1T激活参数，120T训练数据，会吐出阶段性思考成果然后继续思考

OpenAI即将发布GPT-4.5，本周内上线。该模型拥有1T激活参数和120T训练数据，上下文窗口长度达256K，并具备多模态能力。GPT-4.5会在安卓版ChatGPT的Pro订阅用户中率先开放，每月200美元。值得注意的是，GPT-4.5在某些任务上的表现参差不齐，可能在编程等领域不如Claude 3.7 Sonnet。此外，GPT-4.5还能制作动画SVG文件和零样本音乐，但不支持受版权保护的歌曲。本周四已临近发布日期，具体发布时间仍待确认。

原文链接

GhostPilot

02-27 10:11:51

分享至

打开微信扫一扫

内容投诉

生成图片

AI幻觉：它真的会一本正经胡说八道！

AI幻觉是指AI生成看似合理但实际上错误的信息，常见于信息缺失或不确定时。AI通过统计关系预测而非逻辑推理，易受训练数据局限性和过拟合问题影响。此外，有限的上下文窗口和生成流畅回答的设计也加剧了这一现象。降低AI幻觉的方法包括优化提问、分批输出、交叉验证、使用RAG技术和利用AI幻觉的创造性。AI在知识迷雾中可能创造出虚幻的“影子”，但正确使用和协作能使其成为得力助手。

原文链接

跨界思维

02-19 18:54:46

分享至

打开微信扫一扫

内容投诉

生成图片

马斯克：现实世界中用于训练 AI 模型的数据已经所剩无几

马斯克在与Stagwell董事会主席马克・佩恩的直播对话中表示，现实世界中用于训练AI模型的数据已接近耗尽，这一现象去年开始显现。他提出合成数据是未来的解决方案，即AI自己生成训练数据。Gartner预计到2024年，60%的人工智能和数据分析项目数据将通过合成方式生成。合成数据能降低成本，例如Writer公司的Palmyra X 004模型开发成本仅70万美元，而相似规模的OpenAI模型需460万美元。然而，合成数据也可能导致模型性能下降，输出结果缺乏创新性和偏颇性。

原文链接

像素宇宙

01-09 16:00:26

分享至

打开微信扫一扫

内容投诉

生成图片

不止OpenAI，谷歌和Anthropic AI模型开发也被爆遇瓶颈

近日，多家顶尖AI公司遭遇开发瓶颈，包括OpenAI、谷歌和Anthropic。据彭博社报道，OpenAI的下一代模型“猎户座”（Orion）在9月完成首轮训练后，未能达到预期性能，特别是在处理未训练的编码问题时表现不佳。谷歌即将推出的Gemini模型和Anthropic的Claude模型计划发布时...

原文链接

DreamCoder

11-14 10:10:27

分享至

打开微信扫一扫

内容投诉

生成图片

消息称 OpenAI、谷歌等巨头 AI 模型遇瓶颈：训练数据难寻，成本高昂

据彭博社报道，多家人工智能巨头如OpenAI、谷歌和Anthropic在开发更先进AI模型时遭遇瓶颈，面临“收益递减”的困境。OpenAI的最新模型Orion在编码任务上的表现不如预期，谷歌即将推出的Gemini软件也面临类似问题，Anthropic则推迟了Claude 3.5 Opus模型的发布。这些挑战主要源于难以获取新的、高质量的训练数据以及开发和运营成本高昂。业内专家认为，传统的更多计算能力、更多数据和更大模型不一定能带来更好的性能。企业正探索替代方法，例如在模型初步训练后进行额外训练以优化回答和语气，以及开发特定任务的AI工具，如预订航班或发送邮件。AI初创公司Hugging Face的首席伦理科学家Margaret Mitchell表示，实现通用人工智能（AGI）的方法可能需要改变。这一情况发生在11月13日。

原文链接

量子思考者

11-13 22:52:12

分享至

打开微信扫一扫

内容投诉

生成图片

研究揭示 AI 对话方面的缺陷：不知道何时该插话

11月12日至16日，在迈阿密举行的自然语言处理经验方法会议（EMNLP 2024）上，图夫茨大学的研究揭示了AI对话的缺陷：AI在对话中“插话”的时机掌握不佳，影响了其对话能力。研究指出，人类在对话中通过语言内容判断“话轮转换点”（TRP），而AI主要依赖互联网上的书面内容训练，缺乏口语对话的经验。AI擅长检测书面内容中的模式，但在理解和参与自然对话方面仍存在局限，难以真正理解对话的语境和意图。研究人员建议，通过增加对话数据集的训练，可使AI更自然地参与对话，但收集大规模自然口语数据仍是挑战。该研究已在arXiv预印本服务器上发表。

原文链接

元界筑梦师

11-11 23:47:11

分享至

打开微信扫一扫

内容投诉

生成图片

消息称 OpenAI 新 AI 模型进步放缓，公司探索新策略应对挑战

**摘要：** 11月11日，据《The Information》报道，OpenAI下一代旗舰模型Orion的进步幅度可能不及前代模型GPT-4。尽管Orion的表现超越现有OpenAI模型，但在某些领域，如编码，其表现甚至不如GPT-3。内部测试显示，Orion与GPT-3到GPT-4之间的显著进步相比，进步幅度较小。为应对这一挑战，OpenAI成立了一个基础团队，研究如何在训练数据减少的情况下提升模型性能。新策略包括使用AI模型生成合成数据来训练Orion，并在训练后进行更多优化。目前，OpenAI尚未对此报道做出回应。此前，该公司曾表示今年没有计划发布名为Orion的模型。（本文200字，保留关键信息和时间点）

原文链接

数码游侠

11-11 19:41:51

分享至

打开微信扫一扫

内容投诉

生成图片

Coatue重磅报告解读：空间大模型与通用机器人

Coatue发布重磅报告，探讨"具身智能"与通用机器人未来。报告指出AI机器人有望成为颠覆性力量，但现实中与Demo间的差距明显。AI机器人正从执行单一任务向通用型转变，空间大模型推动理解物理世界。核心挑战在于缺乏训练数据，数据采集方法包括远程操作、AR、仿真和视频学习。报告预测，随着技术进步和成本降低，人型机器人将在2026-2027年进入成本低于人类薪酬的阶段，引发劳动力市场变革。此外，报告分析了机器人发展的路径、能力成长曲线，以及投融资热潮下形成的机器人生态系统。最后，报告提到AI机器人可能复制PC时代的两种商业模式，马斯克的Optimus项目备受关注。

原文链接