用于复杂语境的言论抽取模型训练方法、装置和电子设备制造方法及图纸

技术编号：38809087 阅读：17 留言：0更新日期：2023-09-15 19:47

本发明专利技术公开了用于复杂语境的言论抽取模型训练方法、装置和电子设备，属于语言智能处理技术领域。训练方法包括：构建标注有标签的言论内容变长文本为训练数据；利用训练数据对言论抽取模型进行训练，通过学习变长文本的语义表示以输出所述变长文本中每个单词的标签；利用输出的标签与标注的标签优化所述言论抽取模型的参数，以得到训练好的言论抽取模型。训练好的言论抽取模型能够在编码的词表示之上以一种更连续的方式适应具有不同结构的长跨度文本，不仅能够解决言论内容结构复杂和变长带来的抽取召回率和准确率低的问题，而且对于直接言论和间接言论的抽取都具有较高的召回率，模型的性能可以达到工业界可以实际使用的程度。的程度。的程度。

全部详细技术资料下载

【技术实现步骤摘要】
用于复杂语境的言论抽取模型训练方法、装置和电子设备

[0001]本专利技术涉及语言智能处理
，尤其涉及一种用于复杂语境的言论抽取模型训练方法、装置和电子设备。

技术介绍

[0002]言论抽取的目标是从文本中抽取出言论三元组：言论持有者(source)，触发词(cue)和言论内容(content)。比如说，对于给定文本，“Yetforallthesymbolismandfeel
‑
goodvalueofsuchan appointment,somedemocratsprivatelyexpressreservationsabout entrustingaseatthatcoulddecidethebalanceofpowerintheclosely dividedsenatetoacandidatewhohasneverwonstatewide,isconsidered lessthandynamicandhasbeenananemicfundraiser.”，抽取到的言论持有者为“somedemocrats”，触发词为“privatelyexpress”，言论内容为“reservationsaboutentrustingaseatthatcoulddecidethebalanceof powerinthecloselydividedsenatetoacandidatewhohasneverwon statewide,isconsideredlessthandynamicandhasbeenan...

【技术保护点】

【技术特征摘要】
1.一种用于复杂语境的言论抽取模型训练方法，其特征在于，包括：构建训练数据，所述训练数据为标注有标签的言论内容变长文本；利用所述训练数据对言论抽取模型进行训练，通过学习变长文本的语义表示以输出所述变长文本中每个单词的标签；利用输出的标签与标注的标签优化所述言论抽取模型的参数，以得到训练好的言论抽取模型。2.如权利要求1所述的用于复杂语境的言论抽取模型训练方法，其特征在于，所述利用所述训练数据对言论抽取模型进行训练，通过学习变长文本的语义表示以输出所述变长文本中每个单词的标签包括：对所述变长文本进行编码，得到所述所述变长文本中各个单词的隐变量表示；对各个单词的隐变量表示进行语义学习，得到所述变长文本的语义表示；利用所述变长文本的语义表示计算各个单词的标签概率分布，并基于标签概率分布选择标签。3.如权利要求2所述的用于复杂语境的言论抽取模型训练方法，其特征在于，所述对各个单词的隐变量表示进行语义学习，得到所述变长文本的语义表示包括：利用输入加强层对各个单词的隐变量表示进行格式化得到格式化信息，所述格式化信息包括当前单词的隐变量表示、当前单词前文的隐藏层状态、当前单词后文的隐藏层状态以及当前单词前文单词的标签；对所述格式化信息依次进行门控制和注意力控制，以得到所述变长文本的语义表示。4.如权利要求3所述的用于复杂语境的言论抽取模型训练方法，其特征在于，所述对所述格式化信息依次进行门控制和注意力控制，以得到所述变长文本的语义表示包括：利用门控制层使用门机制控制所述格式化信息并将结果输入至注意力控制层；利用所述注意力控制层使用注意力机制在向量级别对所述格式化信息进行加权，得到所述变长文本的语义表示。5.如权利要求1所述的用于复杂语境的...

【专利技术属性】
技术研发人员：王业全，李响，姜鑫，
申请(专利权)人：北京智源人工智能研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人