一个增量式构建常识图谱的名目 iText2KG
iText2KG是一个开源名目,能够应用大型言语模型(zero-shot)跨畛域从文本中提取实体和相关,智能构建和降级常识图谱,并经过Neo4j启动可视化。
iText2KG由四个关键模块组成:文档提取器、增量实体提取器、增量相关提取器、图形集成器和可视化。它们协同上班,从非结构化文本构建和可视化常识图谱。
iText2KG全体架构概述
四个模块中,增量实体提取器与增量相关提取器最为关键,驳回大模型来成功,LLM提取代表一个惟一律念的实体,以防止语义混合的实体。
显示了经常使用 Langchain JSON 解析器的实体和相关提取prompt。分类如下:蓝色 - 由 Langchain 智能格局化的prompt;惯例 - iText2KG设计的prompt;斜体 - 专门为实体和相关提取设计的prompt。(a)相关提取prompt和(b)实体提取prompt。
为了说明常识图谱构建的结果,在三种不同场景下,将基线方法与iText2KG启动了比拟:
在三个场景中,基线方法与iText2KG在常识图谱构建方面的比拟
Incremental Knowledge Graphs Construction Using Large Language Models
本文转载自 PaperAgent