1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

6月16日消息,哈佛大学法学院图书馆在微软与OpenAI支持下,开源首个AI训练数据集“Institutional Books 1.0”。该数据集收录了哈佛馆藏的98.3万本书籍,涵盖245种语言、2420亿个Token,40%为英语书籍,主要集中于19至20世纪,分为20个主题。每本书提供完整元数据,包括作者、出版年份、语言及来源等信息。未来,哈佛大学计划扩展数据内容,已与波士顿公共图书馆合作,将历史报纸数字化加入数据集。此外,他们还将开发AI工具,提升馆藏整理效率并推动负责任的数据使用规范。

原文链接
本文链接:https://kx.umi6.com/article/20290.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
砸钱抢市场,AI 搜索企业 Perplexity 向印度 3.6 亿用户免费赠送原价 200 美元的一年 Pro 服务
2025-07-18 16:42:44
豆神超能训练场计划7月21日开放 AI教育由“泛概念”进入可持续商业模式搭建
2025-07-18 09:38:53
9家光模块上市公司披露上半年业绩预告 新易盛同比最高预增近4倍
2025-07-18 21:46:36
24小时热文
更多
扫一扫体验小程序