Data Commons - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

整合海量公共数据，谷歌开源 AI 统计学专家 DataGemma

谷歌近日推出大型数据库Data Commons及基于其构建的AI统计学专家DataGemma，旨在解决大语言模型产生幻觉的问题。Data Commons是一个包含来自联合国、疾控中心等机构的2500亿个数据点的开源公共统计数据库。DataGemma则通过通用架构将大型语言模型(LLM)与数据连接，解决选择知识来源、确定查询对象和生成查询等三大问题。为优化LLM的使用，作者提出RIG(检索交错生成)和RAG(检索增强生成)两种方法，分别通过微调模型生成查询并转换为结构化数据查询，从而从Data Commons数据库中检索答案。RIG和RAG方法均得到了显著提升事实准确性的结果。Data Commons和DataGemma的发布标志着AI领域在处理大规模公共数据和提高模型准确性上的重要进展，具有时效性和创新性。

原文链接