论文笔记Adversarial Multi-lingual Neural Relation Extraction

19 Nov 2018 | NLP |

论文(Wang X, Han X, Lin Y, et al. Adversarial Multi-lingual Neural Relation Extraction[C]//Proceedings of the 27th International Conference on Computational Linguistics. 2018: 1156-1166.) 使用对抗性神经网络来进行多语言的关系抽取。

论文的主要贡献：

使用对抗性网络来获取语言一致性信息
使用卷积网络来获取语言多样性信息

在表达同一种意思的时候，人们的表达形式是多种多样的，可以是声音，可以是手势，可以是图像，可以是文字。那么论文作者认为在不同语言之间也是存在语言一致性的，所以使用对抗网络来获取语言一致性信息。同时，不同语言本身是具有多样性的，所以还需考虑语言的多样性信息。

输入

语料是由汉语与英语构成的。一个示例由一个三元组，多个英语句子，多个汉语句子构成，这些句子共用同一个三元组。

Note：实体是可以用id来表示的，比如汉语“比利时”和英语“Belgium”对应同一个id：Q31

Instance:

(entity1, rel, entity2)
  en:  
       sen_en1
       sen_en2
       sen_en3

  zh:  
       sen_zh1
       sen_zh2

网络架构

网络整体的架构包括单语关系抽取与多语关系抽取。

为了更加直观的理解模型，我画了一个参数模型。

第一部分是判别器：判别器由多个线性层组成，用于区分语言（0代表英语，1代表汉语）
第二部分是卷积编码器：卷积编码器是为了抽取语言特征，将意义相同多种语言映射到同一个空间；它主要由词嵌入、卷积、池化操作构成
关系抽取：进行单语与多语的关系抽取

对抗网络

判别器：将语言进行卷积编码，然后输入到判别器，判别器的输出是0或者1，用于区分是哪一种语言；欺骗器：将语言进行卷积编码，然后输入到判别器，让判别器的输出是1或者0，尽量不让判别器做出正确的区分。

经上面反复的训练，对抗网络最终达到一个平衡的状态，无法区分出是哪一种语言了，效果就是：表达意义一样的多语句子映射到同一个空间的时候会很接近，不同意义的句子就会离的很远。

多语关系抽取

多语关系抽取会利用对抗网络中训练的参数。两种语言经过share_encoder进行特征的提取，然后使用注意力机制提取各自语言句子特征，最终合并成一个统一的向量进行关系分类。

单语关系抽取

单语关系抽取就是对各个语言进行独立的抽取，不会使用共享参数，经过词嵌入、卷积池化、注意力机制关系分类来预测结果。

输出

输出是对176种关系进行分类预测

跨语言关系抽取

所以跨语言关系抽取就是结合单语与多语抽取结果作为最终的结果，进行反向传播，进行训练。

Midnight