1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

LLM能替代数据科学家了?DeepAnalyze帮你告别手动分析数据

你是否为复杂文件和海量数据而头疼?是否希望自动挖掘出有价值的信息?最近,人大与清华的研究团队推出了一款名为 DeepAnalyze 的工具——你的专属“数据科学家”。只需一个指令,它便能自动化完成数据分析、建模、可视化等任务,甚至生成研究报告。

DeepAnalyze 是首个面向数据科学的 Agentic LLM,无需预设工作流,仅凭一个大模型即可自主完成多种复杂任务。其论文、代码、模型和数据已开源,目前在 GitHub 上获得 1.1K+ 星标。

DeepAnalyze 的核心能力

DeepAnalyze 能在真实环境中学习并优化操作,完成从数据准备到洞察的全流程任务。当前的数据智能体通常依赖人工设计的工作流,难以实现完全自主。而 DeepAnalyze 提出了两项创新方法,突破了这一限制:

  1. 课程学习式 Agentic 训练
    模拟人类数据科学家的学习路径,从简单到复杂逐步训练模型。先微调基础能力(如代码生成、逻辑推理),再通过真实任务环境提升多能力协作水平,避免因任务过于复杂导致训练失败。

  2. 面向数据的轨迹合成
    自动生成 50 万条数据科学推理与交互轨迹,为模型提供示范和引导。包括推理轨迹合成(基于现有任务构建完整推理路径)和交互轨迹合成(通过多智能体系统模拟真实环境交互)。

支持深度研究与报告生成

DeepAnalyze 不仅擅长常规数据分析,还能生成具备分析师水准的研究报告。相比现有的闭源 LLM,其内容深度和结构更胜一筹。

团队背景

DeepAnalyze 由中国人民大学信息学院 RUC-DataLab 团队开发,负责人是范举教授。团队专注于数据技术与人工智能的融合,致力于打造智能化数据系统。主要研究方向包括数据库智能化(AI4DB)、数据技术支持 AI 系统(DB4AI)以及数智融合的新型数据科学系统(AI4DS)。

项目资源:
论文:https://arxiv.org/pdf/2510.16872
代码:https://github.com/ruc-datalab/DeepAnalyze
模型:https://huggingface.co/RUC-DataLab/DeepAnalyze-8B
数据:https://huggingface.co/datasets/RUC-DataLab/DataScience-Instruct-500K
更多示例:https://ruc-deepanalyze.github.io/

原文链接
本文链接:https://kx.umi6.com/article/27626.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
英伟达推出通用深度研究系统,可接入任何LLM,支持个人定制
2025-09-08 13:59:39
世界模型又近了?MIT惊人研究:LLM已模拟现实世界,绝非随机鹦鹉!
2024-08-19 12:33:58
AI 编程能力哪家强?阿里通义千问 Qwen 推 CodeElo 基准,OpenAI o1-mini 夺冠超 90% 人类程序员
2025-01-04 14:16:12
AI Agent的市场规模,将是SaaS的十倍?
2024-11-25 09:03:45
ChatGPT真能记住你的话吗?DeepMind与开源大佬揭示LLM记忆之谜
2024-06-02 00:33:31
LLM数据短缺危机:2028年或耗尽文本资源
2024-06-14 22:27:49
GPT-4不是世界模型,LeCun双手赞同,ACL力证LLM永远无法模拟世界
2024-06-17 09:33:33
两句话,让 LLM 逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出 GPT、Claude 等重大缺陷
2024-06-10 18:37:26
AI圈纷纷传阅,Andrej Karpathy 的最新演讲全文来了
2025-06-23 17:26:53
Nature:「人类亲吻难题」彻底难倒LLM,所有大模型全部失败!LLM根本不会推理,只是工具
2024-11-18 10:17:27
MSRA清北推出强化预训练!取代传统自监督,14B模型媲美32B
2025-06-11 17:15:11
MSRA首席研究员刘炜清:为每位研究员提供AI科研助理,自动化高门槛、重复性工作|中国AIGC产业峰会
2025-04-24 17:40:14
LLM时代,FPGA跑AI会比GPU更强吗?
2024-06-12 08:46:33
24小时热文
更多
扫一扫体验小程序