华人博士发127页长文 人造言语处置中图神经网络从入门到知晓
图是一种可用来形容和建模复杂系统的通用言语。
图在NLP的环球里无处不在,比如用来形容句法消息的dependency tree和constituency tree,以及形容语义消息的AMR graph。
相比于繁难地把人造言语建模成词袋(bag)或许序列(sequence),图能捕捉到人造言语更丰盛和粗疏的消息。
因此,关于许多NLP义务而言,图是一种十分正当的表示方式。
例如,关于跨文本阅读了解义务,假设能够抽取出文本中的实体消息,并以图的方式建设起它们之间各种咨询,将能有效协助文本了解。
而图神经网络(GNN)恰好最长于处置和建模图结构数据的。
GNN的原理
GNN的上班原理繁难详情就是,聚合节点的街坊节点/边的消息,来降级节点的向量表征。
近年来,深度学习曾经成为NLP畛域的关键技术手腕。
在GNN被引入和普遍运行之前,深度学习畛域不时缺少一种神经网络架构,能够像CNN适宜处置网格数据那样,适宜处置任用意结构数据。
随着GNN钻研的继续炽热,越来越多的钻研开局尝试用GNN来处置各类NLP疑问。
近期,来自京东硅谷研发核心的首席迷信家吴凌飞博士和他的团队就宣布了第一篇详细的关于GNNs for NLP的综述。
论文:
Github:
本文从「NLP图构建」、「NLP图表示学习」、「基于GNN的Encoder-decoder模型」和「GNN在NLP义务中的运行」四个维度对现有钻研停顿作了详细的回忆与解读。
整篇综述总共127页,其中蕴含87页注释,12种图构建方法,12个运行场景触及NLP各方各面。
除此之外,其中笼罩了500篇顶级AI/ML/NLP的文章,并在最后对目前所面临的应战与未来的钻研方向作出了独到的总结。
NLP图构建、NLP图表示学习、基于GNN的Encoder-decoder模型和GNN在NLP义务中的运行
不论是想要了解该方向的最新钻研停顿,概览GNNs for NLP运行pipeline,抑或是对其中某个子模块感兴味,本文都将让你有所收获。
作者所在团队还为本文装备了graph4nlp library,已在github上颁布,给想要入手实操的钻研者们提供了十分好的时机。
GNN4NLP钻研面临的应战
虽然在各类NLP义务上,GNN曾经大获成功,但是GNN4NLP依然是一个相对年轻且极速开展的钻研畛域,并面临诸多应战:
智能化图构建
不同类型的NLP义务往往须要不同层面的文本消息。例如,词性、句法等消息关于命名实体识别义务比拟有协助;而关于阅读了解义务而言,实体相关等语义消息会很有协助。
另一方面,不同类型的图通常蕴含不同类型的消息。所以,如何选用适宜的图构建方式关于GNN在下游义务的体现至关关键。
本文将目前已知的一切图构建方式分为两类:静态构图方式和灵活构图方式。
静态图构建
静态图构建有两大特点:
dependency graph和constituency graph两种静态图构建方式
本文从以往宣布的文献中,总结出10余种有代表性的静态图构建方式,并将其归类为句法消息、语义消息、主题消息等多个维度。
灵活图构建
灵活图构建是近两年来新兴产生的一种智能构图方式,其最大的特点是:
灵活图构建的经常出现流程:
同时,本文总结了各类目前已知有效的灵活图构建方式,并演绎出如下4个技术维度和相应的代表性技术。
图表示学习
当从非结构化的文本中失掉到了想要的图,又该如何启动图表示学习?
不要慌,本文从几百篇文献中,系统性的总结了实践钻研中碰到的图的类型,以及怎样转化,最终怎样用、用什么GNN启动编码学习的流程。
首先,依据图的节点和边的属性能否惟一,将图归类为:
其次,这些图之间是存在相互转化的或许的,因此本文总结了这些不同的图或许存在的转化形式,比如说如何从一个异构图转化成多相关图等等。
这些转化为图神经网络的运行提供了更多的或许与选用。
最后,当搞分明图的结构和转化后,该如何选用适宜的图神经网络启动学习?
本文总结了针对每一种图目前已有的经典的图神经网络,让经常使用起来不再感到无从下手!
流程图
编码器-解码器模型
Encoder-decoder架构可以说是近年来NLP畛域中运行最为普遍的框架之一。
但在不同义务场景中,如何量体裁衣地设计encoder,decoder,也是极为关键的疑问。
结合GNN对图结构数据的弱小建模才干,许多钻研者开局关注如何在Encoder-decoder架构中用好GNN。
本文对这个方向的钻研停顿作了系统地梳理和回忆,并将相关文献分为以下三个类别:
Graph2Seq&Graph2Tree示用意
关于这三个角度,本文详细引见了Graph based encoder-decoder模型的开展头绪。
其中不只包括GNN的经常使用,也有各种各样相关的decoding techniques。
同时,关于最近备受关注的基于graph transformer的生成模型,本文也对此启动了剖析对比,并总结了一些如今面临的关键应战。
NLP运行义务
那么,图神经网络终究被用到哪儿了呢?
本文总结了来自12个不同的方向,26个义务共百余篇文献,带来最详尽的实践运行解读:
关于每一个义务,依照以下三点启动剖析:
针对最关心的方法局部,本文做了如下总结:
总结
团队引见
本文的作者是:
京东硅谷研发核心(JD.COM Silicon Valley Research Center)的首席迷信家吴凌飞博士;西蒙弗雷泽大学的裴健传授;京东批发个人搜查和介绍平台部副总裁龙波博士等钻研者。
Graph4NLP 相关软件包,综述,讲座和文献:
Survey:
Library:
Demo:
Tutorials: Graph4NLP-NAACL'21(Slides: google drive, baidu netdisk(drs1))
Literature Review:
论文地址: