1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

LLM能替代数据科学家了?DeepAnalyze帮你告别手动分析数据

你是否为复杂文件和海量数据而头疼?是否希望自动挖掘出有价值的信息?最近,人大与清华的研究团队推出了一款名为 DeepAnalyze 的工具——你的专属“数据科学家”。只需一个指令,它便能自动化完成数据分析、建模、可视化等任务,甚至生成研究报告。

DeepAnalyze 是首个面向数据科学的 Agentic LLM,无需预设工作流,仅凭一个大模型即可自主完成多种复杂任务。其论文、代码、模型和数据已开源,目前在 GitHub 上获得 1.1K+ 星标。

DeepAnalyze 的核心能力

DeepAnalyze 能在真实环境中学习并优化操作,完成从数据准备到洞察的全流程任务。当前的数据智能体通常依赖人工设计的工作流,难以实现完全自主。而 DeepAnalyze 提出了两项创新方法,突破了这一限制:

  1. 课程学习式 Agentic 训练
    模拟人类数据科学家的学习路径,从简单到复杂逐步训练模型。先微调基础能力(如代码生成、逻辑推理),再通过真实任务环境提升多能力协作水平,避免因任务过于复杂导致训练失败。

  2. 面向数据的轨迹合成
    自动生成 50 万条数据科学推理与交互轨迹,为模型提供示范和引导。包括推理轨迹合成(基于现有任务构建完整推理路径)和交互轨迹合成(通过多智能体系统模拟真实环境交互)。

支持深度研究与报告生成

DeepAnalyze 不仅擅长常规数据分析,还能生成具备分析师水准的研究报告。相比现有的闭源 LLM,其内容深度和结构更胜一筹。

团队背景

DeepAnalyze 由中国人民大学信息学院 RUC-DataLab 团队开发,负责人是范举教授。团队专注于数据技术与人工智能的融合,致力于打造智能化数据系统。主要研究方向包括数据库智能化(AI4DB)、数据技术支持 AI 系统(DB4AI)以及数智融合的新型数据科学系统(AI4DS)。

项目资源:
论文:https://arxiv.org/pdf/2510.16872
代码:https://github.com/ruc-datalab/DeepAnalyze
模型:https://huggingface.co/RUC-DataLab/DeepAnalyze-8B
数据:https://huggingface.co/datasets/RUC-DataLab/DataScience-Instruct-500K
更多示例:https://ruc-deepanalyze.github.io/

原文链接
本文链接:https://kx.umi6.com/article/27626.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Nature:「人类亲吻难题」难倒 LLM,所有大模型全部失败
2024-11-16 19:35:47
MSRA首席研究员刘炜清:为每位研究员提供AI科研助理,自动化高门槛、重复性工作|中国AIGC产业峰会
2025-04-24 17:40:14
ChatGPT 真能记住你的话吗?DeepMind 与开源大佬揭示 LLM 记忆之谜
2024-06-01 15:32:44
Llama 8B 搜索 100 次超越 GPT-4o,推理 + 搜索即可提升性能
2024-08-16 10:03:35
LeCun被痛批:烧掉千亿算力,把Meta搞砸了
2025-04-20 09:06:21
LLM进入「拖拽时代」!只靠Prompt,几秒定制一个大模型,效率飙升12000倍
2025-06-24 17:19:19
15亿流量,为何没带来AI游戏的『王者荣耀 』
2024-10-30 14:08:48
LeCun 与 OpenAI 阿尔特曼达成共识:承认 AGI 5 到 10 年降临,但 LLM 注定死路一条
2024-11-29 14:59:53
联想全球CIO报告:企业AI支出规模增至3倍 投资回报率等挑战亟待突破
2025-02-12 16:37:39
LLM 带来了「编程末日」?哥本哈根大学计算机教授称“永远不会”
2025-01-11 15:37:55
医疗 AI 迎来大考,南洋理工发布首个 LLM 电子病历处理评测
2025-12-15 22:01:14
强化学习之父:LLM主导只是暂时,扩展计算才是正解
2025-06-10 18:52:34
微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单CPU就能跑,性能与同规模全精度开源模型相当
2025-04-21 12:38:13
24小时热文
更多
扫一扫体验小程序