到图 RAG RAG 赋予大型言语模型更弱小的常识力气从传统

2024-11-15

大型言语模型 (LLMs) 在固定数据集上启动训练，其常识在最后一次性训练降级时就已固定。

ChatGPT 的惯例用户或许曾经留意到其妇孺皆知的局限性：“ 训练数据截止到 2021 年 9 月 ”。

这种局限性会造成模型发生不准确或过期的照应，由于它们会“ 幻觉 ”信息。

在不从新训练或微调的状况下，用新信息降级模型或增强其高低文了解才干，在资源和人力方面都极具应战。

检索增强生成 (RAG)

检索增强生成 (简称 RAG) 是一种经过整合来自外部牢靠常识库的信息来改良大型言语模型 (LLMs) 的技术。

RAG 面前的原理很便捷：当 LLM 被问到一个疑问时，它不会仅仅依赖于自己已有的常识。

同样，它会首先从指定的常识源中查找相关信息。

这种方法确保了生成的输入援用了少量语境丰盛的數據，并经过最新的相关信息启动增强。

RAG 关键经过两个阶段的流程来运作：检索和 内容生成 。

检索阶段

在检索阶段，算法会定位并搜集与用户揭示或查问相关的相关信息片段。

例如，假设你想搜查福建面食的食谱，你的揭示或许是“_福建面食的配料是什么？_”

系统会识别出与查问语义相关的文档，并经常使用相似度度量来计算其相关性，理论经常使用 余弦相似度 ( Is Cosine-Similarity of Embeddings Really About Similarity?) 来启动计算。

在搜集外部常识后，它会将其附加到用户的揭示中，并将其作为增强后的输入发送到言语模型。

内容生成阶段

在随后的生成阶段，LLM 将此增强后的揭示与其自身的训练数据示意相联合，以生成一个针对用户查问的定制化照应。

该照应提供了一种共性化和可验证信息，适宜经过聊天机器人等运行程序经常使用。

检索增强生成

RAG 的关键性

在当今的技术畛域，LLMs 驱动着泛滥人造言语运行程序，能够了解或生成相似人类的文本。

虽然这些模型性能弱小，但有时也会发生无余。

有时，它们在生成不正确的照应时会过于自信，以致于人们很容易被它们极具压服力的论据所影响。

RAG 的局限性

就像生存中的一切事物一样，传统的 RAG 方法也有其复杂性和应战。

虽然 RAG 在增强 LLMs 的性能方面具备开创性，但它也存在一些局限性，这些局限性会影响其有效性和实用性。

其中一个关键应战触及检索信息的准确性和数据源异质性。

RAG 成功也遇到了一些艰巨，例如处置含混的查问或须要深化了解高低文的查问。

这些疑问是技术设计固有的疑问，关键源于检索环节，检索环节有时会疏忽发生准确照应所需的纤细差异。

高低文很关键，一个失当的逗号也是如此

RAG 的改良

提高 RAG 系统的检索准确率和效率是人造言语处置和机器学习畛域继续启动的钻研方向。

为了成功这些改良，可以采取多种战略，但我想要重点引见两种在当今技术条件下可以成功的显着改良。

这将咱们引向…

图 RAG：RAG x 常识图谱

图 RAG 在 RAG 的概念基础上，应用了常识图谱 (KGs)。

这种翻新方法是由 NebulaGraph 独创的概念，它经过整合图数据库，扭转了 LLMs 解释和照应查问的模式。

图 RAG 经过将 KGs 中的结构化数据整合到 LLM 的处置中，为模型的照应提供了更粗疏入微和信息丰盛的基础。

KGs 是对事实环球实体及其相关的结构化示意。

它们蕴含两个关键局部：_节点_和_边_。

节点代表单个实体，例如_人物_、_地点_、_物体_或_概念_。

另一方面，边代表这些节点之间的相关，标明它们是如何相互衔接的。

一个便捷的常识图谱

这种结构极大地提高了 LLMs 生成有见地的照应的才干，由于它使模型能够访问准确且与高低文相关的數據。

图 RAG 的翻新之处在于它将图数据库与 LLMs 整合，以在生成照应之前丰盛模型的高低文。

一些盛行的图数据库产品包括, NebulaGraph 和。

图 RAG 的关键意义

随着 LLMs 继续在复杂性和才干方面始终开展，图 RAG 有或许对 AI 畛域发生严重影响。

以下是我对这种整合如何演化的展望：

图 RAG 可以应用这些提高来提供更准确、更富含高低文的答案。

来自常识图谱的结构化常识，再加上更复杂的 LLMs，或许会造成 AI 无了解形象概念、推理以及生成粗疏入微的照应方面取得打破。

这或许包括依据环球事情或发事实时降级 KGs。

LLMs 可以经过将从用户交互或其余数据源搜集的新信息整合到常识图谱中，在智能增强和降级常识图谱方面施展作用。

经常使用诸如来自人类反应的强化学习 (RLHF) 和来自 AI 反应的强化学习 (RLAIF) 等技术可以进一步协助模型与人类偏好坚持分歧，并遵守(不是摔跤手，而是协助、老实、有害) 准则。

这种转变将使图 RAG 能够运行于更宽泛的运行程序，包括那些须要实时照应或在资源有限的环境中运转的运行程序。

例如，运行认知迷信的发现或许会造成开发更人造的人机交互模型，或许将网络安保与心思学相联合或许会提高安保措施的有效性。

这或许象征着不同的成功可以相互交互和单干，从而推进更宽泛的驳回和翻新。

图 RAG 演示

在本演示中，咱们将经常使用 Govtech 的开发者门户网站 中的产品信息作为咱们的常识库。

数据集示例。咱们将很快将其转换为可用的格局。

Neo4j Desktop 界面

\# 创立常识图谱的说明\## 概述您被设计用于将数据组织成常识图谱。\- \*\*节点\*\*: 代表实体和想法。\- 指标是确保常识图谱便捷易懂，便于宽泛经常使用。\## 节点标志\- \*\*分歧性\*\*: 对节点经常使用便捷的标签。例如，将任何组织实体标志为“公司”，而不是经常使用诸如“Facebook”或“Amazon”之类的术语。\- \*\*节点标识符\*\*: 选用文本或可了解的标识符，而不是数字标识符。- \*\*准许的节点标签\*\*: 假设存在特定准许的节点标签，请在此处列出。- \*\*准许的相关类型\*\*: 假设存在特定准许的相关类型，请在此处列出。\## 治理数值数据和日期\- 将数值信息间接作为节点的属性集成。\- \*\*集成日期/数字\*\*: 不要为日期或数字创立独自的节点，而是将它们作为属性附加。\- \*\*属性情式\*\*: 经常使用键值对格局。\- \*\*防止经常使用引号\*\*: 在属性值中不要经常使用转义引号。\- \*\*键命名\*\*: 驳回 camelCase 命名键，例如 \`dateTime\`。\## 分歧性\- \*\*实体分歧性\*\*: 确保跨不同提及或援用的实体分歧地识别。## 遵守指南严厉遵守这些说明是强迫性的。不遵守将造成中断。

该环节破费了近一个小时，最终发生了提取的节点标签列表

{"identity": 1040,"labels": \["Feedbackstatus"\],"properties": {"id": "Feedback-Success","message": "已发送。感谢您的反应！”},"elementId": "4:81cd2613-0f18-49c1-8134-761643e88b7a:1040"},{"identity": 1582,"labels": \["Feedbackstatus"\],"properties": {"id": "Feedbacksuccess","status": "已发送。感谢您的反应！”},"elementId": "4:81cd2613-0f18-49c1-8134-761643e88b7a:1582"},{"identity": 1405,"labels": \["Header"\],"properties": {"id": "Modalcardhead","class": "sgds-modal-card-head"},"elementId": "4:81cd2613-0f18-49c1-8134-761643e88b7a:1405"},{"identity": 1112,"labels": \["Feedbackindicator"\],"properties": {"id": "Feedbacksuccess","title": "check","message": "已发送。感谢您的反应！”},"elementId": "4:81cd2613-0f18-49c1-8134-761643e88b7a:1112"...

permissible\_nodes\_to\_extract = \["Aisubfield","Application","Cloudservice","Concept","Digitalsolution","Division","Entity","Feature","Fundinginitiative","Initiative","Link","Location","Organization","Person","Platform","Policy","Program""Resource","Role","Schema","Service","Standard","Technology","Technologyplatform","Technologystack","Webframework","Webresource","Website"\]

好多了！

经过一切致力，魔法终于开局了！

思考以下查问：

Q: “请通知我更多对于 AiSay 的信息，谁开发了这款产品，以及它的长处和运行。另外，请通知我 AiSay 的共同之处。”

基础 RAG: “AiSay 是一款由新加坡政府开发的 AI 驱动的文档阅读器。它可以智能检测、扫描和了解各种类型的文档，包括手写笔记、印刷文章、多言语文本以及结构化/非结构化文档。与传统的 OCR 系统不同，AiSay 可认为图像和 PDF 文件等文档提供结构化的照应。它经常使用 OCR、文档问答技术和大型言语模型来推导出高低文并回答查问。AiSay 可裁减，具备同步和异步伐用选项，准许处置大型文件。它在云上托管为无主机，使其在体积上可裁减，能够处置大型文件。AiSay 正在踊跃开发中，支持安保性和数据分类，最高可达 RESTRICTED/SENSITIVE NORMAL。展望未来，将支持更多文档类型。AiSay 的共同性能包括它能够为各种文档类型提供结构化的照应，其可裁减性和对安保性和数据分类的支持。”

图 RAG: “AiSay 是一款由新加坡政府开发的 AI 驱动的文档阅读器。它是一个文档解析器，可以提供结构化的照应，提取和整合来自各种文档的信息到现有系统中。AiSay 可以智能检测、扫描和了解各种类型的文档，包括手写笔记、印刷文章、多言语文本以及结构化/非结构化文档。与传统的光学字符识别 (OCR) 系统不同，AiSay 可认为图像 (JPEG、PNG、TFIF) 和 PDF 文件等文档提供结构化的照应。

AiSay 的一些关键长处包括：

AiSay 在为各种文档类型提供结构化照应方面自成一家，支持多种格局和言语。它还为每个义务提供置信度得分，以确定能否须要额外支持，从而在置信度高的义务中成功起码的人工干预。此外，AiSay 可裁减，由于它在云上托管为无主机，使其能够处置大型文件和异步提取环节。”

图 RAG 与基础 RAG 的比拟

在本例中，图 RAG 与传统 RAG 方法相比的长处显而易见。

该照应不只证实了准确性，而且还丰盛了高低文和相关，提供了一种规范 RAG 方法所没有的深度。

图 RAG 的秘密在于它能够剖析用户的查问，在图数据库中确定相关數據，并将这种高低文洞察整合到疏导 LLM 照应的环节中。

这种方法应用了一个传统方法或许错过的相互关联的信息网络，从而对查问有了更粗疏入微的了解。

让咱们再尝试几个例子

Q: “我须要从一些文档中删除敏感信息。Govtech 提供哪些具备这些性能的产品？”

基础 RAG: “Govtech 提供 Cloak 和 FileSG 这两种产品，它们具备协助从文档中删除敏感信息的性能。”

图 RAG: “GovTech 提供一款名为 Cloak 的产品，它是一个用于合乎政策的數據匿名化的中央隐衷工具包。该产品协助公务员将數據匿名化技术运行于数据集，并依据指南审查从新识别危险。”

咱们须要处置你频繁的操控行为

Q: “DIAB 与 SIaC 有什么不同？”

基础 RAG: “提供的文档没有间接比拟数据基础设备一体化 (DIAB) 与任何名为 SIaC 的物品，也没有提及 SIaC。因此，依据给定的高低文，不可间接概述 DIAB 和 SIaC 之间的差异。但是，咱们可以总结 DIAB 的关键方面如下：

由于没无对于 SIaC 的信息，因此不可启动比拟。DIAB 的特点突出了其作为政府机构在云中有效部署和治理数据基础设备的工具的作用，它应用 IaC 来提高效率和可裁减性。”

图 RAG: “DIAB (数据基础设备一体化) 和 SIaC (安保基础设备即代码) 都是旨在为政府机构简化云基础设备部署的产品。但是，它们在详细关注点和性能方面有所不同。

DIAB 作为商业云政府 (GCC) 上数据基础设备部署和保养的减速器。它协助机构构建、部署和包全数据基础设备，专一于数据工程方面的思考，并提供基础设备即代码 (IaC) 模板。DIAB 的指标是协助机构构建分歧且可裁减的数据基础设备，其关键长处包括易用性、提高效率、内置合规性、部署灵敏性和未来证实。

另一方面，SIaC 提供可定制的模板，用于以安保、合规和智能化的模式部署云基础设备。它专一于安保性能来自云服务提供商的托管服务和工具，具备模块化且易于顺应的模板。SIaC 的关键性能包括遵守新加坡政府规范、针对不同用例的模块化、与 SGTS 组件的集成以及云原生设计。

总而言之，虽然 DIAB 和 SIaC 都旨在为政府机构简化云基础设备部署，但 DIAB 专一于数据基础设备部署，重点关注数据工程方面的思考和 IaC 模板，而 SIaC 专一于安保且合规的云基础设备部署，具备可定制的模板和模块化设计。”

论断

从传统的检索增强生成 (RAG) 向图 RAG 的转变，代表了咱们与大型言语模型 (LLMs) 交互模式的关键提高。

这种转变处置了以下基本应战：_如何提高 LLMs 提供与高低文相关的准确答案以应回答杂查问的才干_。

当比拟这两种方法时，图 RAG 在处置与高低文相关的复杂查问方面的长处变得显而易见。

传统的 RAG 技术往往不可处置与高低文相关的复杂疑问。

相比之下，图 RAG 应用了更复杂的数据网络，提供能捕捉到查问纤细之处更深入了解的照应。

但是，图 RAG 的有效性并非一种一刀切的处置打算。

它依然高度依赖于底层 KGs 的品质、深度和广度。

在 KG 有限或倾向特定畛域的场景中，图 RAG 的性能或许不可超越传统 RAG 方法。

虽然如此，这种转变有望造成 AI 系统更好地模拟人类的思想和发现。

本文转载自，作者：

<<外围技术剖析 RAG文档解析器

一文梳理大言语模型编程框架>>

到图 RAG RAG 赋予大型言语模型更弱小的常识力气 从传统