1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

6月16日消息,哈佛大学法学院图书馆在微软与OpenAI支持下,开源首个AI训练数据集“Institutional Books 1.0”。该数据集收录了哈佛馆藏的98.3万本书籍,涵盖245种语言、2420亿个Token,40%为英语书籍,主要集中于19至20世纪,分为20个主题。每本书提供完整元数据,包括作者、出版年份、语言及来源等信息。未来,哈佛大学计划扩展数据内容,已与波士顿公共图书馆合作,将历史报纸数字化加入数据集。此外,他们还将开发AI工具,提升馆藏整理效率并推动负责任的数据使用规范。

原文链接
本文链接:https://kx.umi6.com/article/20290.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
哈佛大学、谷歌发布 100 万本公共领域书籍,为 AI 训练提供合法数据
2024-12-13 09:18:29
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
2025-06-16 23:15:51
8 年首次大突破:谷歌祭出 Transformer 杀手,掌门人划出 AGI 死线
2025-12-07 15:34:40
山东省“十五五”规划建议:加快机器人和智能装备推广应用 打造低空经济发展集聚区、内河新能源船舶制造基地
2025-12-08 09:21:09
中国电信董事长柯瑞文:加快推进算力基础设施建设 强化国产算力芯片适配
2025-12-07 21:52:07
马斯克“太空AI”设想:每年发射1百万吨AI卫星、建设月球卫星工厂
2025-12-08 16:37:25
美的“美罗 U”首曝,行业首创六臂轮足式人形机器人
2025-12-07 15:33:32
戴尔科技集团 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案
2025-12-06 10:23:57
厦门“十五五”规划建议:强化算力、算法、数据等高效供给 发展壮大数字经济核心产业
2025-12-08 14:32:20
阴和俊:在量子科技等领域布局建设未来产业 加强对国家重大科技任务和科技型企业的金融支持
2025-12-08 10:23:04
跨境电商的疑难杂症,被1688这个AI全包了…
2025-12-07 13:28:44
Oculus 创始人拉奇为在战争中使用 AI 辩护:使用落后技术并无道德高地可言
2025-12-08 09:15:22
Gartner 调查:仅 20% 客服支持主管表示因 AI 削减团队规模
2025-12-08 14:31:10
24小时热文
更多
扫一扫体验小程序