首个任务型对话系统中生成模块资源库Awesome-TOD-NLG-Survey开源!

原创作者:覃立波、黎州扬、娄杰铭、禹棋赢、车万翔
代码链接:https://github.com/yizhen20133868/Awesome-TOD-NLG-Survey
转载须标注出处:哈工大SCIR

简介

自然语言生成(Natural Language Generation, NLG)作为任务型对话系统中的核心模块,越来越受到学术界和工业界的关注。NLG模块的目的是将系统生成的语义表示(Meaning Representations,MR),包括对话动作(Dialog Act)和一系列槽值对(Slot Pairs),转化为用户可以理解的自然语言系统回复。

以图1为例,NLG模块的输入包含对话动作inform和槽值对(name=Blue Spice,priceRange=low,familyFriendly=yes),NLG的作用是将输入转换为对应的自然语言回复:“The Blue Spice is a low cost venue. It is a family friendly location.

图1  NLG模块的输入输出

近些年来,随着深度神经网络和预训练语言模型的发展,NLG 的研究已经取得了重大的突破。尽管目前 NLG 模型在标准数据集上达到了相当高的性能,但在实际应用中, 仍有许多问题需要解决。那么该方向的研究现状如何,未来的热点又是什么呢?

为此,我们整理了一个仓库,详细、全面地总结了 NLG 领域发展过程中的工作,包括方法分类和一些相关的开源资源,并且涵盖了一些前沿方向的讨论。我们希望该工作能够对促进该领域发展贡献力量,也相信该资源库值得对 NLG 领域感兴趣的同学们了解和关注。仓库的总体目录如图2所示。

图2 仓库总体目录

仓库内容
1. 新分类,全总结

我们将目前的 NLG 方法总体分类为传统方法和基于深度学习的方法,并分别按照细分的小类归纳整理。其中, 基于深度学习的方法分为基于 RNN 、基于 Seq2Seq 和基于 Transformer 的三种方法进行分类。

图3 不同的NLG方法总体架构
2. 开源的NLG论文仓库整理

我们介绍了现有的 NLG 相关的论文和已经开源的仓库,并标注了论文使用的相关数据集,可以帮助大家利用代码学习。

图4 论文目录
3. 数据集整理及下载地址

对于 NLG 使用的经典数据集,我们不仅提供了描述、简介和下载地址,还对数据集的细节、规模和状态进行了总结,帮助大家方便地了解和找到相关的数据集。

图5 数据集及下载地址
4. Leaderboard 整理
对于主流的数据集,我们还整理了 leaderboard,方便大家跟踪进展。
图6 leaderboard 整理
5. 未来挑战方向及相关工作整理
为了促进该领域的发展,我们还总结了NLG的未来方向,并且整理了目前为止的发表的顶会工作,如跨语言 NLG,可解释 NLG 等。
(0)

相关推荐