1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

LLM能替代数据科学家了?DeepAnalyze帮你告别手动分析数据

你是否为复杂文件和海量数据而头疼?是否希望自动挖掘出有价值的信息?最近,人大与清华的研究团队推出了一款名为 DeepAnalyze 的工具——你的专属“数据科学家”。只需一个指令,它便能自动化完成数据分析、建模、可视化等任务,甚至生成研究报告。

DeepAnalyze 是首个面向数据科学的 Agentic LLM,无需预设工作流,仅凭一个大模型即可自主完成多种复杂任务。其论文、代码、模型和数据已开源,目前在 GitHub 上获得 1.1K+ 星标。

DeepAnalyze 的核心能力

DeepAnalyze 能在真实环境中学习并优化操作,完成从数据准备到洞察的全流程任务。当前的数据智能体通常依赖人工设计的工作流,难以实现完全自主。而 DeepAnalyze 提出了两项创新方法,突破了这一限制:

  1. 课程学习式 Agentic 训练
    模拟人类数据科学家的学习路径,从简单到复杂逐步训练模型。先微调基础能力(如代码生成、逻辑推理),再通过真实任务环境提升多能力协作水平,避免因任务过于复杂导致训练失败。

  2. 面向数据的轨迹合成
    自动生成 50 万条数据科学推理与交互轨迹,为模型提供示范和引导。包括推理轨迹合成(基于现有任务构建完整推理路径)和交互轨迹合成(通过多智能体系统模拟真实环境交互)。

支持深度研究与报告生成

DeepAnalyze 不仅擅长常规数据分析,还能生成具备分析师水准的研究报告。相比现有的闭源 LLM,其内容深度和结构更胜一筹。

团队背景

DeepAnalyze 由中国人民大学信息学院 RUC-DataLab 团队开发,负责人是范举教授。团队专注于数据技术与人工智能的融合,致力于打造智能化数据系统。主要研究方向包括数据库智能化(AI4DB)、数据技术支持 AI 系统(DB4AI)以及数智融合的新型数据科学系统(AI4DS)。

项目资源:
论文:https://arxiv.org/pdf/2510.16872
代码:https://github.com/ruc-datalab/DeepAnalyze
模型:https://huggingface.co/RUC-DataLab/DeepAnalyze-8B
数据:https://huggingface.co/datasets/RUC-DataLab/DataScience-Instruct-500K
更多示例:https://ruc-deepanalyze.github.io/

原文链接
本文链接:https://kx.umi6.com/article/27626.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Claude 团队打开大模型“脑回路”,推出开源 LLM 思维可视化工具
2025-05-31 23:12:07
英伟达最新技术分享:手把手教你用 Llama 3.1 合成数据改进模型!附代码
2024-07-29 17:59:43
英伟达推出通用深度研究系统,可接入任何LLM,支持个人定制
2025-09-08 13:59:39
LLM能替代数据科学家了?DeepAnalyze帮你告别手动分析数据
2025-11-01 13:29:57
Llama 8B 搜索 100 次超越 GPT-4o,推理 + 搜索即可提升性能
2024-08-16 10:03:35
LLM 的“母语”是什么?
2024-06-03 07:50:10
Andrej Karpathy 盛赞!斯坦福团队新作,让Llama-1B 实现毫秒级推理
2025-06-03 12:57:05
Nature:「人类亲吻难题」难倒 LLM,所有大模型全部失败
2024-11-16 19:35:47
AI 编程能力哪家强?阿里通义千问 Qwen 推 CodeElo 基准,OpenAI o1-mini 夺冠超 90% 人类程序员
2025-01-04 14:16:12
LLM进入「拖拽时代」!只靠Prompt,几秒定制一个大模型,效率飙升12000倍
2025-06-24 17:19:19
LLM时代,FPGA跑AI会比GPU更强吗?
2024-06-12 08:46:33
LLM 带来了「编程末日」?哥本哈根大学计算机教授称“永远不会”
2025-01-11 15:37:55
LeCun 与 OpenAI 阿尔特曼达成共识:承认 AGI 5 到 10 年降临,但 LLM 注定死路一条
2024-11-29 14:59:53
24小时热文
更多
扫一扫体验小程序