基于知识图谱的少样本和零样本学习综述

引言

随着人工智能的飞速开展,机器学习,特意是深度学习,在过去几十年中在许多畛域和运行中取得了清楚的成就。例如,卷积神经网络(CNN)在图像分类和视觉对象识别方面的准确性经常超越人类,推进了智能驾驶车辆、面部识别、手写识别、图像检索和遥感图像处置等运行的极速开展。雷同,循环神经网络(RNN)和基于Transformer的模型在序列学习和人造言语了解方面取得了成功,这些技术推进了机器翻译、语音识别和聊天机器人等运行的开展。但是,大少数机器学习模型的高功能依赖于少量的标志样本启动(半)监视学习,而这些标志样本无理想环球运行中往往老本高昂或不够有效。

在这种背景下,零样本学习(ZSL)和少样本学习(FSL)这两种关键的样本充足设置备受关注。ZSL被定义为预测在训练中从未产生过的新类别(标签),这些新类别被称为未见类别,而在训练中有样本的类别被称为已见类别。与此相对的,FSL旨在预测那些只要大批标志样本的新类别。零样本学习在过去十年里惹起了宽泛的关注,提出了许多处置打算。例如,在零样本图像分类中,曾经经过CNN从已见类别的图像中学习到的图像特色理论间接被用来为未见类别构建分类器。零样本学习方法理论应用形容类别间相关的辅佐消息,如对象的视觉特色(也称为类属性)等。近五年来,知识图谱(KG)作为结构化知识(例如资源形容框架(RDF)三元组)的一种宽泛经常使用的示意方式,惹起了宽泛的关注,一些基于知识图谱增强的零样本学习方法甚至在许多义务中到达了最先进的功能。

本文回忆了这些钻研畛域的90多篇文章,引见了ZSL和FSL中经常使用的知识图谱及其构建方法,并系统地归类和总结了知识图谱感知的ZSL和FSL方法,将它们分为不同的范式,如基于映射、数据增强、基于流传和基于提升等。此外,本文还引见了不同的运行畛域,包括但不限于图像分类、疑问回答、文本分类、知识提取,以及知识图谱补全义务等,最终讨论了不同视角下的应战和未来的钻研方向。

动机和奉献

零样本学习(ZSL)和少样本学习(FSL)的背景

ZSL的定义和运行畛域

ZSL的开展和辅佐消息

FSL的开展

知识图谱(KG)的背景

定义和范围

通用目的的KGs

ZSL和FSL的KG构建

知识图谱驱动的零样本学习(KG-aware ZSL)

基于映射的范式 (Mapping-Based Paradigm)

基于数据增强的范式 (Data Augmentation Paradigm)

基于流传的范式 (Propagation-Based Paradigm)

基于类别特色的范式 (Class Feature Paradigm)

知识图谱驱动的少样本学习(KG-aware FSL)

基于映射的范式 (Mapping-Based Paradigm)

基于数据增强的范式 (Data Augmentation Paradigm)

基于流传的范式 (Propagation-Based Paradigm)

基于类别特色的范式 (Class Feature Paradigm)

基于提升的范式 (Optimization-Based Paradigm)

基于迁徙学习的范式 (Transfer-Based Paradigm)

ZSL和FSL比拟

运行方向和数据集(Applications & Resources)

计算机视觉 (Computer Vision)

人造言语处置 (Natural Language Processing)

知识图谱补全 (KG Completion)

KG品质 (KG Quality)

学习范式 (Learning Paradigms)

ZSL和FSL在KG构建中的运行 (ZSL and FSL in KG Construction)

基准测试 (Benchmarking)

作者:

您可能还会对下面的文章感兴趣: