【技术实现步骤摘要】
信息生成方法与装置、训练方法、电子设备和存储介质
[0001]本专利技术属于人工智能
,具体涉及一种信息生成方法与装置、训练方法、电子设备和存储介质。
技术介绍
[0002]文博领域文本语言风格独特,包含大量古代中文,语法结构与现代普通话结构相差甚远,在实体关系抽取时,往往因语法结构的特殊性导致实体关系对难以鉴别,古汉语自身的语义特点也使得字面意思不能准确理解。
[0003]目前应用于通用语言风格的实体关系抽取技术使用语言预训练模型对输入语句进行编码,但语言预训练模型是由通用文本的预料库进行训练,对专有领域的文本适应性较差,因此难以在文博领域的文本中取得较好的效果。
技术实现思路
[0004]有鉴于此,本专利技术提供了一种文博领域事件信息生成方法,以至少部分解决上述技术问题。
[0005]上述文博领域事件信息生成方法包括:获取采用文博领域语言风格描述目标历史事件的多个目标汉语语句,目标汉语语句中包括长实体词组和非长实体词组;将多个目标汉语语句输入初编码层,以便通过初编码层对每个目标汉语语 ...
【技术保护点】
【技术特征摘要】
1.一种文博领域事件信息生成方法,其特征在于,包括:获取采用文博领域语言风格描述目标历史事件的多个目标汉语语句,所述目标汉语语句中包括长实体词组和非长实体词组;将所述多个目标汉语语句输入初编码层,以便通过所述初编码层对每个所述目标汉语语句进行初编码后,输出多个初编码字向量,其中所述初编码字向量为所述目标汉语语句中的每个字的第一上下文特征表示;将所述多个初编码字向量输入风格化编码网络,以便通过所述风格化编码网络对所述多个初编码字向量进行文博领域风格化编码后,输出多个词向量,其中所述词向量包括所述目标汉语语句中的长实体词组和非长实体词组的上下文特征表示;将所述多个词向量输入解码器,以便通过所述解码器对所述多个词向量进行解码后输出与所述目标历史事件关联的事件信息,其中所述事件信息包括与所述目标历史事件关联的多个三元组,其中每个所述三元组包括第一实体、第二实体以及所述第一实体和所述第二实体之间的关系,所述第一实体和所述第二实体的实体类别包括以下至少之一:人物、事件、时间、地点、事物、文物、年代。2.根据权利要求1所述的方法,其特征在于,还包括:利用与所述目标历史事件关联的多个三元组,生成与所述目标历史事件关联的知识图谱,所述知识图谱包括第一图形元素、第二图形元素、第三图形元素,所述第一图形元素与所述第一实体关联,所述第二图形元素与所述第二实体关联,所述第三图形元素与所述第一实体和所述第二实体之间的关系关联。3.根据权利要求1所述的方法,其特征在于,所述风格化编码网络包括语言风格化层和可学习字典层,所述通过所述风格化编码网络对所述多个初编码字向量进行文博领域风格化编码后,输出多个词向量包括:将所述多个初编码字向量输入所述语言风格化层,以便通过所述语言风格化层对所述多个初编码字向量进行特征优化后输出多个风格化字向量,其中所述风格化字向量为所述目标汉语语句中的每个字的第二上下文特征表示;将所述多个风格化字向量输入所述可学习字典层,以便利用所述可学习字典层对所述多个风格化字向量进行词编码后,输出多个词向量。4.根据权利要求3所述的方法,其特征在于:所述语言风格化层包括加掩码的双向自注意力网络、前馈神经网络;所述可学习字典层包括加掩码的单向自注意力网络、前馈神经网络。5.一种文本识别模型训练方法,其特征在于,包括:获取训练文本,其中所述训练文本为采用文博领域语言风格描述预选历史事件的多个预选汉语语句,所述训练文本中包括长实体词组和非长实体词组;构建所述训练文本的文本标签,其中所述文本标签包括与所述预选历史事件关联的多个标签三元组,其中每个所述标签三元组包括第一实体、第二实体以及所述第一实体和所述第二实体之间的关系,所述第一实体和所述第二实体的实体类别包括以下至少之一:人物、事件、时间、地点、事物、文物、年代;将所述多个预选汉语语句输入初编码层,以便通过所述初编码层对每个所述预选汉语语句进行初编码后,输出多个初编码字训练向量,其中所述初编码字训练向量为所述预选
汉语语句中的每个字的第一上下文特征表示;将所述多个初编码字训练向量输入待训练风格化编码网络,以便通过所述待训练风格化编码网络对所述多个初编码字训练向量进行文博领域风格化编码后,输出多个词训练向量,其中所述词训练向量包括所述训练文本中的长实体词组和非长实体词组的上下文特征表示;将所述多个词训练向量输入解码器,以便通过所述解码器对所述多个词训练向量...
【专利技术属性】
技术研发人员:金沛然,刘冠辰,徐健,王志新,高杰,韩国民,
申请(专利权)人:河南文数保智能科技研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。