一种事件识别模型的训练方法和装置制造方法及图纸

技术编号：20944558 阅读：24 留言：0更新日期：2019-04-24 02:25

本发明专利技术实施例公开了一种事件识别模型的训练方法和装置，用于实现不依赖触发词的事件识别模型训练，提高事件识别模型的训练效率。该方法包括：从训练数据库中获取到目标事件类型和第一文本样本，并将所述目标事件类型和所述第一文本样本输入到初始的事件识别模型中，所述事件识别模型中配置有注意力层；通过所述注意力层获取所述第一文本样本中每个词相对于所述目标事件类型的关注度信息；根据所述第一文本样本中每个词相对于所述目标事件类型的关注度信息，通过所述事件识别模型输出所述第一文本样本与所述目标事件类型的关联结果；根据所述事件识别模型输出的所述关联结果，采用预设的损失函数对所述事件识别模型进行训练。

A Training Method and Device for Event Recognition Model

The embodiment of the present invention discloses an event recognition model training method and device for realizing event recognition model training independent of trigger words and improving the training efficiency of event recognition model. The method includes: obtaining the target event type and the first text sample from the training database, and inputting the target event type and the first text sample into the initial event recognition model. The event recognition model is equipped with a attention layer; and obtaining the attention of each word in the first text sample relative to the target event type through the attention layer. Degree information; according to the attention information of each word in the first text sample relative to the target event type, the correlation result between the first text sample and the target event type is output through the event recognition model; and according to the correlation result output by the event recognition model, the event recognition model is trained with a preset loss function.

全部详细技术资料下载

【技术实现步骤摘要】
一种事件识别模型的训练方法和装置
本专利技术涉及计算机
，尤其涉及一种事件识别模型的训练方法和装置。
技术介绍
事件是一个复杂的概念，对事件进行准确的定义是一个非常困难的问题，学术界和工业界至今为止没有公认的定义。在不同领域的研究中，事件具有不同的定义及表示。在面向新闻文本进行事件识别的场景下，采用自动内容抽取(AutomaticContentExtraction，ACE)为事件给出如下的定义：事件是发生在某个特定时间(时间段)、某个特定地域范围内，由一个或多个角色参与的由一个或多个动作构成的事情或状态的改变。事件识别的方法可以分为基于模式匹配的方法和基于机器学习的方法。其中，基于模式匹配的方法是指对某种类型事件的识别和抽取是在预设模式的指导下进行的，采用各种模式匹配的算法将待识别的事件和已知的模式进行匹配。模式匹配的过程就是事件识别和抽取的过程。基于模式匹配的方法具有可移植性差、召回率低的缺陷。现有技术还提供基于机器学习的方法用于事件识别，但是需要通过对触发词的识别来完成。例如，假设需要对文本“潘长江恩师李春明去世”进行事件识别，通过机器学习的方法识别到“去世”是一个死亡事件的触发词，因此判定该文本描述了一个死亡事件。现有技术中需要将触发词的识别建模为词分类的问题。具体地，将给定文本中的每个词作为候选的触发词，并对其进行分类，目标类别需要是预先定义好的事件类型。现有技术中对事件的识别依赖事件的触发词，因此在模型训练过程中标注数据时，不仅要标注出每个文本的事件类型，还要标注出相应的触发词。由于触发词是文本中最能指示某一事件发生的词，人工挑选触发词的难...

【技术保护点】
1.一种事件识别模型的训练方法，其特征在于，包括：从训练数据库中获取到目标事件类型和第一文本样本，并将所述目标事件类型和所述第一文本样本输入到初始的事件识别模型中，所述事件识别模型中配置有注意力层；通过所述注意力层获取所述第一文本样本中每个词相对于所述目标事件类型的关注度信息；根据所述第一文本样本中每个词相对于所述目标事件类型的关注度信息，通过所述事件识别模型输出所述第一文本样本与所述目标事件类型的关联结果；根据所述事件识别模型输出的所述关联结果，采用预设的损失函数对所述事件识别模型进行训练。

【技术特征摘要】
1.一种事件识别模型的训练方法，其特征在于，包括：从训练数据库中获取到目标事件类型和第一文本样本，并将所述目标事件类型和所述第一文本样本输入到初始的事件识别模型中，所述事件识别模型中配置有注意力层；通过所述注意力层获取所述第一文本样本中每个词相对于所述目标事件类型的关注度信息；根据所述第一文本样本中每个词相对于所述目标事件类型的关注度信息，通过所述事件识别模型输出所述第一文本样本与所述目标事件类型的关联结果；根据所述事件识别模型输出的所述关联结果，采用预设的损失函数对所述事件识别模型进行训练。2.根据权利要求1所述的方法，其特征在于，所述将所述目标事件类型和所述第一文本样本输入到初始的事件识别模型中，包括：根据所述目标事件类型查询词向量表，得到第一事件类型向量和第二事件类型向量，所述第一事件类型向量为局部信息建模向量，所述第二事件类型向量为全局信息建模向量；从所述第一文本样本中识别出每个词对应的命名实体类型，并将所述每个词以及所述每个词对应的命名实体类型转换为词样本向量；将所述第一事件类型向量、所述第二事件类型向量和所述词样本向量输入到所述事件识别模型中。3.根据权利要求2所述的方法，其特征在于，所述从所述第一文本样本中识别出每个词对应的命名实体类型，并将所述每个词以及所述每个词对应的命名实体类型转换为词样本向量，包括：对所述第一文本样本进行分词处理从而得到词序列，所述词序列包括多个词；对所述词序列中的每个词分别进行命名实体识别，得到所述每个词对应的命名实体类型；将所述每个词转换为相应的词向量，并将所述每个词对应的命名实体类型转换为相应的命名实体类型向量；将所述每个词对应的词向量和命名实体类型向量拼接在一起，得到所述词样本向量。4.根据权利要求2所述的方法，其特征在于，所述通过所述注意力层获取所述第一文本样本中每个词相对于所述目标事件类型的关注度信息，包括：通过所述事件识别模型对所述词样本向量进行表示信息提取，得到所述第一文本样本中每个词对应的词表示向量；通过所述注意力层获取所述第一文本样本中每个词对应的词表示向量和所述第一事件类型向量之间的关注度信息。5.根据权利要求4所述的方法，其特征在于，所述根据所述第一文本样本中每个词相对于所述目标事件类型的关注度信息，通过所述事件识别模型输出所述第一文本样本与所述目标事件类型的关联结果，包括：按照所述第一文本样本中每个词对应的词表示向量和所述第一事件类型向量之间的关注度信息，对所述第一文本样本中每个词对应的词表示向量进行加权平均计算，得到所述第一文本样本对应的文本表示向量；根据所述第一文本样本对应的文本表示向量和所述第一事件类型向量获取所述第一文本样本的局部信息；根据所述第一文本样本中最后一个输入所述事件识别模型的词表示向量和所述第二事件类型向量获取所述第一文本样本的全局信息；对所述第一文本样本的局部信息和所述第一文本样本的全局信息进行加权平均计算，得到所述第一文本样本与所述目标事件类型的关联结果。6.根据权利要求4所述的方法，其特征在于，所述通过所述事件识别模型对所述词样本向量进行表示信息提取，得到所述第一文本样本中每个词对应的词表示向量，包括：通过所述事件识别模型中提取到所述第一文本样本中第t-1个词对应的词表示向量之后，将所述第一文本样本中第t个词对应的词样本向量输入到所述事件识别模型中，所述t为大于或等于1的正整数；根据所述第一文本样本中第t-1个词对应的词表示向量，通过所述事件识别模型对所述第一文本样本中第t个词对应的词样本向量进行表示信息提取，得到所述第一文本样本中第t个词对应的词表示向量。7.根据权利要求1至6中任一项所述的方法，其特征在于，所述将所述目标事件类型和所述第一文本样本输入到初始的事件识别模型中，包括：当所述训练数据库中提取到N个所述目标事件类型时，获取N个二元组，其中，每个二元组包括：N个所述目标事件类型的一个目标事件类型和所述第一文本样本，所述N的取值为大于或等于2的正整数；将所述N个二元组分别输入到所述事件识别模型中。8.一种事件识别模型的训练装置，其特征在于，包括：...

【专利技术属性】
技术研发人员：刘树林，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人