1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

6月16日消息,哈佛大学法学院图书馆在微软与OpenAI支持下,开源首个AI训练数据集“Institutional Books 1.0”。该数据集收录了哈佛馆藏的98.3万本书籍,涵盖245种语言、2420亿个Token,40%为英语书籍,主要集中于19至20世纪,分为20个主题。每本书提供完整元数据,包括作者、出版年份、语言及来源等信息。未来,哈佛大学计划扩展数据内容,已与波士顿公共图书馆合作,将历史报纸数字化加入数据集。此外,他们还将开发AI工具,提升馆藏整理效率并推动负责任的数据使用规范。

原文链接
本文链接:https://kx.umi6.com/article/20290.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
2025-06-16 23:15:51
哈佛大学、谷歌发布 100 万本公共领域书籍,为 AI 训练提供合法数据
2024-12-13 09:18:29
Netflix 宣布全力投入 AI:“能帮人类把故事讲得更好”
2025-10-22 16:48:46
OpenAI掌舵人三年演讲梳理:一文读懂Altman
2025-10-22 18:50:58
两部门:启动2025年度智能制造系统解决方案“揭榜挂帅”项目申报工作
2025-10-22 16:50:23
OpenAI:欧洲业务增长强劲 将继续加大投入
2025-10-24 00:18:56
字节跳动 Seed3D 1.0 发布:一张图就能生成高精度 3D 模型
2025-10-23 14:05:22
Meta将削减人工智能部门约600个职位 以提升决策效率
2025-10-22 23:55:49
阿里夸克AI眼镜24日开启预售 3699元起
2025-10-23 19:13:38
上海开展2025年度中试平台培育储备征集申报工作 涉及集成电路、人工智能等领域
2025-10-22 15:49:20
独家|阿里夸克“C计划”揭晓 上线对话助手 把“豆包”塞了进去
2025-10-23 10:05:55
OpenAI秘密项目曝光:进军投行业务
2025-10-22 16:49:15
大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘
2025-10-23 17:10:54
24小时热文
更多
扫一扫体验小程序