综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
谷歌近日推出大型数据库Data Commons及基于其构建的AI统计学专家DataGemma,旨在解决大语言模型产生幻觉的问题。Data Commons是一个包含来自联合国、疾控中心等机构的2500亿个数据点的开源公共统计数据库。DataGemma则通过通用架构将大型语言模型(LLM)与数据连接,解决选择知识来源、确定查询对象和生成查询等三大问题。为优化LLM的使用,作者提出RIG(检索交错生成)和RAG(检索增强生成)两种方法,分别通过微调模型生成查询并转换为结构化数据查询,从而从Data Commons数据库中检索答案。RIG和RAG方法均得到了显著提升事实准确性的结果。Data Commons和DataGemma的发布标志着AI领域在处理大规模公共数据和提高模型准确性上的重要进展,具有时效性和创新性。
原文链接
加载更多
暂无内容