DataGemma - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

整合海量公共数据，谷歌开源 AI 统计学专家 DataGemma

谷歌近日推出大型数据库Data Commons及基于其构建的AI统计学专家DataGemma，旨在解决大语言模型产生幻觉的问题。Data Commons是一个包含来自联合国、疾控中心等机构的2500亿个数据点的开源公共统计数据库。DataGemma则通过通用架构将大型语言模型(LLM)与数据连接，解决选择知识来源、确定查询对象和生成查询等三大问题。为优化LLM的使用，作者提出RIG(检索交错生成)和RAG(检索增强生成)两种方法，分别通过微调模型生成查询并转换为结构化数据查询，从而从Data Commons数据库中检索答案。RIG和RAG方法均得到了显著提升事实准确性的结果。Data Commons和DataGemma的发布标志着AI领域在处理大规模公共数据和提高模型准确性上的重要进展，具有时效性和创新性。

原文链接

WisdomTrail

10-09 09:59:32

AI统计学家

Data Commons

DataGemma

分享至

打开微信扫一扫

内容投诉

生成图片

谷歌推出 DataGemma：基于可信数据源提高 AI 准确度，减少幻觉

【谷歌推出DataGemma，提升AI准确度】谷歌于9月12日发布新版DataGemma模型，旨在通过集成谷歌数据共享（Data Commons）中的真实世界统计数据，解决大语言模型（LLMs）在处理数值或统计数据时面临的幻觉问题。Data Commons集合了来自联合国和疾病控制与预防中心等可信机...

原文链接