事件主体识别模型优化方法、装置、设备及可读存储介质制造方法及图纸

技术编号:26597839 阅读:14 留言:0更新日期:2020-12-04 21:20
本发明专利技术公开了一种事件主体识别模型优化方法、装置、设备及可读存储介质,所述方法包括将各类事件对应的训练文本输入字符信息提取模块,提取得到训练文本中的字符信息;将字符信息和训练文本输入事件分类模块进行分类,得到训练文本对应的事件分类结果;将事件分类结果、字符信息和训练文本对应的主体标注输入主体识别模块进行识别,得到主体识别损失;基于事件分类结果和训练文本对应的事件类型标注计算分类损失,并优化主体识别损失和分类损失以优化事件主体识别模型。而本发明专利技术中,采用事件分类结果作为主体识别模块的识别依据进行主体识别,降低了事件主体识别的复杂度,从而降低了时间主体识别的错误率。

【技术实现步骤摘要】
事件主体识别模型优化方法、装置、设备及可读存储介质
本专利技术涉及人工智能
,尤其涉及一种事件主体识别模型优化方法、装置、设备及可读存储介质。
技术介绍
在现在很多金融场景中,需要分析媒体报道的很多金融事件以帮助投资决策,甚至是构建量化金融建模指标。事件识别(EventDetective,ED)是要识别文本中的事件类型,事件主体识别是要识别文本中事件的主体。现有的事件主体识别模型对文本进行识别,同时识别事件类型和事件主体,复杂度较高,例如当出现一个主体对应多个事件的情况时,容易出现事件类型判别错误的问题。
技术实现思路
本专利技术的主要目的在于提供一种事件主体识别模型优化方法、装置、设备及可读存储介质,旨在解决目前的事件主体识别的识别准确率不高的问题。为实现上述目的,本专利技术提供一种事件主体识别模型优化方法,所述方法包括以下步骤:待优化的事件主体识别模型包括字符信息提取模块、事件分类模块和主体识别模块,所述方法包括以下步骤:将各类事件对应的训练文本输入所述字符信息提取模块,提取得到所述训练文本中的字符信息;将所述字符信息和所述训练文本输入所述事件分类模块进行分类,得到所述训练文本对应的事件分类结果;将所述事件分类结果、所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别,得到主体识别损失;基于所述事件分类结果和所述训练文本对应的事件类型标注计算分类损失,并优化所述主体识别损失和所述分类损失以优化所述事件主体识别模型。可选地,所述字符信息提取模块包括第一语义理解编码器和第一事件编码信息,所述将各类事件对应的训练文本输入所述字符信息提取模块,提取得到所述训练文本中的字符信息的步骤包括:将所述训练文本输入所述第一语义理解编码器中进行编码,得到所述训练文本中各字符对应的字符编码信息;对所述字符编码信息和所述第一事件编码信息进行关联运算得到字符事件关联信息,将所述字符事件关联信息作为所述字符信息。可选地,所述主体识别模块为识别主体和关键词的模块,所述将所述事件分类结果、所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别,得到主体识别损失的步骤包括:获取所述训练文本对应的关键词标注;将所述事件分类结果、所述字符信息、所述关键词标注和所述主体标注输入所述主体识别模块进行识别,得到主体和关键词识别损失,将所述主体和关键词识别损失作为所述主体识别损失。可选地,所述获取所述训练文本对应的关键词标注的步骤包括:获取所述训练文本所属事件类型对应的预设种子关键词和备选词;采用预设词向量模型将所述预设种子关键词和所述备选词分别转换为词向量;计算所述备选词的词向量与所述预设种子关键词的词向量之间的相似度,并选取相似度大于预设相似度的备选词添加至所述事件类型对应的关键词库;将所述训练文本与所述关键词库中各关键词进行匹配,以确定所述训练文本中的关键词,并采用所述训练文本中的关键词对所述训练文本进行序列化标注得到所述关键词标注。可选地,所述事件分类模块包括第二语义理解编码器、第二事件编码信息和事件分类器,所述将所述字符信息和所述训练文本输入所述事件分类模块进行分类,得到所述训练文本对应的事件分类结果的步骤包括:将所述训练文本输入所述第二语义理解编码器进行编码,得到所述训练文本对应的文本编码信息;对所述文本编码信息和所述第二事件编码信息进行关联运算得到文本事件关联信息;将所述字符信息和所述文本事件关联信息输入所述事件分类器,得到所述训练文本对应的事件分类结果。可选地,所述第二事件编码信息包括各类事件对应的编码信息,所述优化所述主体识别损失和所述分类损失以优化所述事件主体识别模型的步骤之前,还包括:基于所述第二事件编码信息计算各类事件两两之间编码信息的相似度,并将各相似度相加得到事件编码惩罚值;所述优化所述主体识别损失和所述分类损失以优化所述事件主体识别模型的步骤包括:优化所述事件编码惩罚值、所述主体识别损失和所述分类损失以优化所述事件主体识别模型。可选地,所述将各类事件对应的训练文本输入所述字符信息提取模块,提取得到所述训练文本中的字符信息的步骤之前,还包括:采用所述训练文本对初始事件主体识别模型中的字符信息提取模块和事件分类模块进行预设轮次的训练,以优化所述初始事件主体识别模型,并将优化后的初始事件主体识别模型作为所述待优化的事件主体识别模型。可选地,所述优化所述主体识别损失和所述分类损失以优化所述事件主体识别模型的步骤之后,还包括:当检测到优化后的事件主体识别模型满足预设模型条件时,将优化后的事件主体识别模型作为目标事件主体识别模型;将待识别文本输入所述目标事件主体识别模型的字符信息提取模块,提取得到所述待识别文本中的字符信息;将所述待识别文本的字符信息和所述待识别文本输入所述目标事件主体识别模型中的事件分类模块,得到所述待识别文本的事件分类结果;将所述待识别文本的事件分类结果和字符信息输入所述目标事件主体识别模型中的主体识别模块进行识别,得到所述待识别文本的事件主体识别结果。为实现上述目的,本专利技术提供一种事件主体识别模型优化装置,待优化的事件主体识别模型包括字符信息提取模块、事件分类模块和主体识别模块,所述装置包括:提取模块,用于将各类事件对应的训练文本输入所述字符信息提取模块,提取得到所述训练文本中的字符信息;分类模块,用于将所述字符信息和所述训练文本输入所述事件分类模块进行分类,得到所述训练文本对应的事件分类结果;识别模块,用于将所述事件分类结果、所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别,得到主体识别损失;优化模块,用于基于所述事件分类结果和所述训练文本对应的事件类型标注计算分类损失,并优化所述主体识别损失和所述分类损失以优化所述事件主体识别模型。为实现上述目的,本专利技术还提供一种事件主体识别模型优化设备,所述事件主体识别模型优化设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的事件主体识别模型优化程序,所述事件主体识别模型优化程序被所述处理器执行时实现如上所述的事件主体识别模型优化方法的步骤。此外,为实现上述目的,本专利技术还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有事件主体识别模型优化程序,所述事件主体识别模型优化程序被处理器执行时实现如上所述的事件主体识别模型优化方法的步骤。本专利技术中,通过设置包含字符信息提取模块、主体识别模块和事件分类模块的待优化事件主体识别模型,并通过将各类事件对应的训练文本输入字符信息提取模块,提取得到训练文本中各字符的信息;将字符信息和训练文本输入事件分类模块进行分类,得到训练文本对应的事件分类结果;将事件分类结果、字符信息和训练文本对应的主体标注输入主体识别模块进行识别,得到主体识别损失;基于事本文档来自技高网...

【技术保护点】
1.一种事件主体识别模型优化方法,其特征在于,待优化的事件主体识别模型包括字符信息提取模块、事件分类模块和主体识别模块,所述方法包括以下步骤:/n将各类事件对应的训练文本输入所述字符信息提取模块,提取得到所述训练文本中的字符信息;/n将所述字符信息和所述训练文本输入所述事件分类模块进行分类,得到所述训练文本对应的事件分类结果;/n将所述事件分类结果、所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别,得到主体识别损失;/n基于所述事件分类结果和所述训练文本对应的事件类型标注计算分类损失,并优化所述主体识别损失和所述分类损失以优化所述事件主体识别模型。/n

【技术特征摘要】
1.一种事件主体识别模型优化方法,其特征在于,待优化的事件主体识别模型包括字符信息提取模块、事件分类模块和主体识别模块,所述方法包括以下步骤:
将各类事件对应的训练文本输入所述字符信息提取模块,提取得到所述训练文本中的字符信息;
将所述字符信息和所述训练文本输入所述事件分类模块进行分类,得到所述训练文本对应的事件分类结果;
将所述事件分类结果、所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别,得到主体识别损失;
基于所述事件分类结果和所述训练文本对应的事件类型标注计算分类损失,并优化所述主体识别损失和所述分类损失以优化所述事件主体识别模型。


2.如权利要求1所述的事件主体识别模型优化方法,其特征在于,所述字符信息提取模块包括第一语义理解编码器和第一事件编码信息,
所述将各类事件对应的训练文本输入所述字符信息提取模块,提取得到所述训练文本中的字符信息的步骤包括:
将所述训练文本输入所述第一语义理解编码器中进行编码,得到所述训练文本中各字符对应的字符编码信息;
对所述字符编码信息和所述第一事件编码信息进行关联运算得到字符事件关联信息,将所述字符事件关联信息作为所述字符信息。


3.如权利要求1所述的事件主体识别模型优化方法,其特征在于,所述主体识别模块为识别主体和关键词的模块,
所述将所述事件分类结果、所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别,得到主体识别损失的步骤包括:
获取所述训练文本对应的关键词标注;
将所述事件分类结果、所述字符信息、所述关键词标注和所述主体标注输入所述主体识别模块进行识别,得到主体和关键词识别损失,将所述主体和关键词识别损失作为所述主体识别损失。


4.如权利要求3所述的事件主体识别模型优化方法,其特征在于,所述获取所述训练文本对应的关键词标注的步骤包括:
获取所述训练文本所属事件类型对应的预设种子关键词和备选词;
采用预设词向量模型将所述预设种子关键词和所述备选词分别转换为词向量;
计算所述备选词的词向量与所述预设种子关键词的词向量之间的相似度,并选取相似度大于预设相似度的备选词添加至所述事件类型对应的关键词库;
将所述训练文本与所述关键词库中各关键词进行匹配,以确定所述训练文本中的关键词,并采用所述训练文本中的关键词对所述训练文本进行序列化标注得到所述关键词标注。


5.如权利要求1所述的事件主体识别模型优化方法,其特征在于,所述事件分类模块包括第二语义理解编码器、第二事件编码信息和事件分类器,
所述将所述字符信息和所述训练文本输入所述事件分类模块进行分类,得到所述训练文本对应的事件分类结果的步骤包括:
将所述训练文本输入所述第二语义理解编码器进行编码,得到所述训练文本对应的文本编码信息;
对所述文本编码信息和所述第二事件编码信息进行关联运算得到文本事件关联信息;
将所述字符信息和所述文本事件关联信息输入所述事件分类器,得到所述训练文本对应的事件分类结果。


6.如权利要求5所述...

【专利技术属性】
技术研发人员:李超吴海山殷磊
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1