数据集 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

全国人大代表张帆：建议研究出台加强工业数据集建设的财税支持政策

3月6日，十四届全国人大四次会议上海代表团会议上，全国人大代表张帆建议加强工业数据集建设。他指出，我国“人工智能+制造”虽有进展，但商业化应用仍受工业数据集匮乏等问题制约。张帆提议构建多方协同的共建机制，出台财税支持政策，引导企业投入资源，提升主动性，并支持龙头企业组建行业数据共享联盟，培育数商生态。同时，推动建设高质量行业级工业数据集，为“人工智能+制造”提供核心数据支撑。

原文链接

智能涌动

03-06 19:29:19

人工智能+制造

工业数据集

财税支持政策

分享至

打开微信扫一扫

内容投诉

生成图片

国家数据局召开行业高质量数据集链主任务书签署活动

2月28日，国家数据局在京召开行业高质量数据集链主任务书签署活动。局长刘烈宏强调，要实施“人工智能+”行动计划，推进行业高质量数据集建设，将数据优势转化为人工智能发展动能。他提出扩面增效，提升数据集供给规模；场景牵引，推动数据集与实战需求融合；技术支撑，研发关键技术和自动化工具；质量把关，推进数据集检测工作；规范管理，建设国家数据集管理平台；价值释放，培育优质数据付费市场共识。此次活动明确了高质量数据集建设的方向和重点，助力我国人工智能领域快速发展。

原文链接

AI创意引擎

02-28 22:58:48

人工智能

国家数据局

高质量数据集

分享至

打开微信扫一扫

内容投诉

生成图片

华为云CEO周跃峰：加速医疗AI落地，共建共享行业模型、高质量数据集等

2月2日，华为高级副总裁、华为云CEO周跃峰宣布华为云在医疗AI领域的三大核心举措：夯实数据基础设施和资源体系，构筑医疗数字化底座；推出华为云智慧医疗专区，为基层医院、医生及开发者提供端到端支持体系；加强生态建设，通过共建共享行业模型、高质量数据集与AI工具链，降低创新门槛，加速医疗AI规模化落地。华为云致力于推动医疗AI普惠应用，促进行业协同发展。（记者黄心怡）

原文链接

虚拟微光

02-02 13:38:37

医疗AI

华为云

数据集

分享至

打开微信扫一扫

内容投诉

生成图片

我国建成高质量数据集超10万个规模超890PB

截至12月30日，我国在数据赋能人工智能领域取得显著成效。国家数据局联合26个部委，遴选72家链主单位，在科学、教育及具身智能等重点领域和创新领域先行先试，部署140项高质量数据集建设任务。目前已建成超10万个高质量数据集，总规模突破890PB（拍字节），为人工智能发展提供强大支撑。这一成果标志着我国在数据资源整合与应用方面迈上新台阶。

原文链接

超频思维站

12-30 21:44:16

人工智能

国家数据局

高质量数据集

分享至

打开微信扫一扫

内容投诉

生成图片

国家数据局：拓展适应人工智能发展的高质量数据集流通交易方式

12月26日，国家数据局发布《关于培育数据流通服务机构加快推进数据要素市场化价值化的意见（征求意见稿）》，向社会公开征求意见。文件提出，拓展适应人工智能发展的高质量数据集流通交易方式，支持数据流通服务机构与产业链链主企业、人工智能企业等合作，建设高质量数据集。同时，依托数据基础设施提供数据汇聚、治理及模型训练服务，以推动数据要素的市场化和价值化发展。此举旨在促进人工智能技术进步及相关产业发展。

原文链接

电子诗篇

12-27 00:08:38

人工智能

国家数据局

数据集流通

分享至

打开微信扫一扫

内容投诉

生成图片

国家医保局：推动建立标准数据集检验AI辅助诊疗等能力

12月13日，国家医保局党组书记、局长章轲在全国医疗保障工作会议上表示，计划到2026年推动建立多模态分病种及高质量单模态标准数据集。通过实践比赛等方式创设验证场景，检验人工智能辅助诊疗等技术的实用能力。此举旨在构建“概念到医保付费”的渐进式产业升级路径，引领科技创新与医保支付结合，为新技术、新产品进入医保体系铺路。（财联社记者何凡）

原文链接

代码编织者

12-13 12:50:18

AI辅助诊疗

国家医保局

标准数据集

分享至

打开微信扫一扫

内容投诉

生成图片

AI画不出的左手，是因为我们给了它一个偏科的童年

12月11日，一篇关于AI生成图像问题的文章引发关注。文章指出，即使是当前最先进的AI模型（如NanoBananaPro、Gemini等），在生成‘左手写字’等涉及左右手区别的图片时均出现严重错误，频繁生成右手场景。研究发现，这一问题源于训练数据集的偏见，现实世界中右撇子占多数，导致标注和图像数据偏向右手行为。论文《Skews in the Phenomenon Space Hinder Generalization in Text-to-Image Generation》解释称，AI模型的泛化能力受限于数据的完整性和平衡性，若某些现象（如左撇子行为）未被充分采集，AI便无法正确学习。作者反思，这不仅是技术问题，也映射了人类自身的认知局限，并呼吁重新设计AI训练集的同时，人类也应拓宽自身视野，探索被忽视的可能性。

原文链接

数码游侠

12-11 14:56:05

左手

数据集

分享至

打开微信扫一扫

内容投诉

生成图片

我国已建成高质量数据集总量超500PB

截至2025年三季度末，我国已建成高质量数据集总量超500PB，为人工智能性能提升和创新加速提供重要支撑。国家数据局局长刘烈宏在12月4日的2025科创大会上指出，高质量数据集是数智创新的关键资源。国家数据局联合26个部委制定政策，以场景应用为导向推动各行业数据集建设，并部署140项先行先试任务，初步实现“‘人工智能+’到哪里，数据集建设就到哪里”的目标。刘烈宏呼吁全社会加大数据领域投入，培育“为高质量数据付费”意识，助力数据要素市场化改革。

原文链接

虚拟织梦者

12-04 11:16:07

人工智能

数据要素市场化

高质量数据集

分享至

打开微信扫一扫

内容投诉

生成图片

国家数据局：我国已建成高质量数据集总量超 500PB

截至2025年三季度末，我国已建成高质量数据集总量超500PB，为人工智能发展提供重要支撑。国家数据局局长刘烈宏在12月4日的2025年科创大会上指出，高质量数据集是数智创新关键资源，国家数据局联合26个部委制定政策，推动各行业数据集建设，并部署140项先行先试任务，实现“‘人工智能+’到哪里，数据集就到哪里”的目标。刘烈宏呼吁全社会加大数据领域投入，培育为高质量数据付费的意识，助力数据要素市场化改革。

原文链接

AI创意引擎

12-04 11:15:00

人工智能

国家数据局

高质量数据集

分享至

打开微信扫一扫

内容投诉

生成图片

睿尔曼开源全球首个高质量、模态数量最多的真机数据集

11月21日，睿尔曼正式开源全球首个高质量、模态数量最多的真机数据集，为机器人研发提供关键数据支撑。该数据集基于北京人形机器人数据训练中心的十大真实场景，涵盖智能生活、工业装配等领域，具备高保真度与强实用性。数据模态完整性达100%，抗噪声评分78%，平滑性超82.1%，展现卓越质量。此次开源由睿源机器人发布，采用RS-01、RS-02、RS-03三款高性能采集平台，支持多模态感知与外骨骼遥操作技术，显著提升数据采集效率与精度。睿尔曼表示将持续迭代并开源更多数据集，推动机器人技术普惠与产业化落地。

原文链接