【技术实现步骤摘要】
事件主体识别模型优化方法、装置、设备及可读存储介质
本专利技术涉及人工智能
,尤其涉及一种事件主体识别模型优化方法、装置、设备及可读存储介质。
技术介绍
在现在很多金融场景中,需要分析媒体报道的很多金融事件以帮助投资决策,甚至是构建量化金融建模指标。事件识别(EventDetective,ED)是要识别文本中的事件类型,事件主体识别是要识别文本中事件的主体。现有的事件主体识别模型对文本进行识别,同时识别事件类型和事件主体,复杂度较高,例如当出现一个主体对应多个事件的情况时,容易出现事件类型判别错误的问题。
技术实现思路
本专利技术的主要目的在于提供一种事件主体识别模型优化方法、装置、设备及可读存储介质,旨在解决目前的事件主体识别的识别准确率不高的问题。为实现上述目的,本专利技术提供一种事件主体识别模型优化方法,所述方法包括以下步骤:待优化的事件主体识别模型包括字符信息提取模块、事件分类模块和主体识别模块,所述方法包括以下步骤:将各类事件对应的训练文本输入所述字符信息提取模块,提取得到所述训练文本中的字符信息;将所述字符信息和所述训练文本输入所述事件分类模块进行分类,得到所述训练文本对应的事件分类结果;将所述事件分类结果、所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别,得到主体识别损失;基于所述事件分类结果和所述训练文本对应的事件类型标注计算分类损失,并优化所述主体识别损失和所述分类损失以优化所述事件主体识别模型。可 ...
【技术保护点】
1.一种事件主体识别模型优化方法,其特征在于,待优化的事件主体识别模型包括字符信息提取模块、事件分类模块和主体识别模块,所述方法包括以下步骤:/n将各类事件对应的训练文本输入所述字符信息提取模块,提取得到所述训练文本中的字符信息;/n将所述字符信息和所述训练文本输入所述事件分类模块进行分类,得到所述训练文本对应的事件分类结果;/n将所述事件分类结果、所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别,得到主体识别损失;/n基于所述事件分类结果和所述训练文本对应的事件类型标注计算分类损失,并优化所述主体识别损失和所述分类损失以优化所述事件主体识别模型。/n
【技术特征摘要】
1.一种事件主体识别模型优化方法,其特征在于,待优化的事件主体识别模型包括字符信息提取模块、事件分类模块和主体识别模块,所述方法包括以下步骤:
将各类事件对应的训练文本输入所述字符信息提取模块,提取得到所述训练文本中的字符信息;
将所述字符信息和所述训练文本输入所述事件分类模块进行分类,得到所述训练文本对应的事件分类结果;
将所述事件分类结果、所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别,得到主体识别损失;
基于所述事件分类结果和所述训练文本对应的事件类型标注计算分类损失,并优化所述主体识别损失和所述分类损失以优化所述事件主体识别模型。
2.如权利要求1所述的事件主体识别模型优化方法,其特征在于,所述字符信息提取模块包括第一语义理解编码器和第一事件编码信息,
所述将各类事件对应的训练文本输入所述字符信息提取模块,提取得到所述训练文本中的字符信息的步骤包括:
将所述训练文本输入所述第一语义理解编码器中进行编码,得到所述训练文本中各字符对应的字符编码信息;
对所述字符编码信息和所述第一事件编码信息进行关联运算得到字符事件关联信息,将所述字符事件关联信息作为所述字符信息。
3.如权利要求1所述的事件主体识别模型优化方法,其特征在于,所述主体识别模块为识别主体和关键词的模块,
所述将所述事件分类结果、所述字符信息和所述训练文本对应的主体标注输入所述主体识别模块进行识别,得到主体识别损失的步骤包括:
获取所述训练文本对应的关键词标注;
将所述事件分类结果、所述字符信息、所述关键词标注和所述主体标注输入所述主体识别模块进行识别,得到主体和关键词识别损失,将所述主体和关键词识别损失作为所述主体识别损失。
4.如权利要求3所述的事件主体识别模型优化方法,其特征在于,所述获取所述训练文本对应的关键词标注的步骤包括:
获取所述训练文本所属事件类型对应的预设种子关键词和备选词;
采用预设词向量模型将所述预设种子关键词和所述备选词分别转换为词向量;
计算所述备选词的词向量与所述预设种子关键词的词向量之间的相似度,并选取相似度大于预设相似度的备选词添加至所述事件类型对应的关键词库;
将所述训练文本与所述关键词库中各关键词进行匹配,以确定所述训练文本中的关键词,并采用所述训练文本中的关键词对所述训练文本进行序列化标注得到所述关键词标注。
5.如权利要求1所述的事件主体识别模型优化方法,其特征在于,所述事件分类模块包括第二语义理解编码器、第二事件编码信息和事件分类器,
所述将所述字符信息和所述训练文本输入所述事件分类模块进行分类,得到所述训练文本对应的事件分类结果的步骤包括:
将所述训练文本输入所述第二语义理解编码器进行编码,得到所述训练文本对应的文本编码信息;
对所述文本编码信息和所述第二事件编码信息进行关联运算得到文本事件关联信息;
将所述字符信息和所述文本事件关联信息输入所述事件分类器,得到所述训练文本对应的事件分类结果。
6.如权利要求5所述...
【专利技术属性】
技术研发人员:李超,吴海山,殷磊,
申请(专利权)人:深圳前海微众银行股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。