综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
谷歌近日推出大型数据库Data Commons及基于其构建的AI统计学专家DataGemma,旨在解决大语言模型产生幻觉的问题。Data Commons是一个包含来自联合国、疾控中心等机构的2500亿个数据点的开源公共统计数据库。DataGemma则通过通用架构将大型语言模型(LLM)与数据连接,解决选择知识来源、确定查询对象和生成查询等三大问题。为优化LLM的使用,作者提出RIG(检索交错生成)和RAG(检索增强生成)两种方法,分别通过微调模型生成查询并转换为结构化数据查询,从而从Data Commons数据库中检索答案。RIG和RAG方法均得到了显著提升事实准确性的结果。Data Commons和DataGemma的发布标志着AI领域在处理大规模公共数据和提高模型准确性上的重要进展,具有时效性和创新性。
原文链接
【谷歌推出DataGemma,提升AI准确度】谷歌于9月12日发布新版DataGemma模型,旨在通过集成谷歌数据共享(Data Commons)中的真实世界统计数据,解决大语言模型(LLMs)在处理数值或统计数据时面临的幻觉问题。Data Commons集合了来自联合国和疾病控制与预防中心等可信机...
原文链接
加载更多
暂无内容