语义关系识别模型的训练方法、装置及终端制造方法及图纸

技术编号:22000200 阅读:36 留言:0更新日期:2019-08-31 05:23
本发明专利技术实施例提出一种语义关系识别模型的训练方法、装置以及终端,方法包括:将样本数据集输入至初始预训练模型中,输出样本句子的表示信息,样本数据集包括多个样本语义单元;获取多个特征词,并将多个特征词进行拼接,得到拼接特征词的表示信息;将样本句子的表示信息和拼接特征词的表示信息输入至初始分类器中,输出样本语义单元之间的语义关系类别;调整初始预训练模型以及初始分类器,得到新预训练模型和新分类器;根据新预训练模型和新分类器建立语义关系识别模型。使用特征词作为篇章关系中的强特征,能够提升在特定语义关系上的分类效果。在利用语义关系识别模型进行语义关系类别的预测时,缩短了预测时间,提高了预测效率。

Training Method, Device and Terminal of Semantic Relation Recognition Model

【技术实现步骤摘要】
语义关系识别模型的训练方法、装置及终端
本专利技术涉及机器学习
,尤其涉及一种语义关系识别模型的训练方法、装置及终端。
技术介绍
篇章语义关系识别是自然语言处理的一个基本任务,它通常是指识别自然语言中基本语义单元(EDU,Elementarydiscourseunit)间的语义关系。被广泛应用在阅读理解系统、情感分析系统、对话问答系统中。对于一个篇章级的文档中,基本语义单元之间的可能会出现多类别的语义关系。例如,常见的语义关系类别有扩展关系(对一个事物或者实体进行细化或泛化的介绍描述)、因果关系(具有因果表示的文档,可以是先因后果、也可以是先果后因)、转折关系(具有语义上的转折或者话题间的转换关系)、并列关系(基本语义单元间具有平等关系,可以是平行的关系、相容的关系、互斥的关系)等。篇章语义关系识别中,如果出现了能够表明语义关系的词语或者词组叫做关联词,比如“因为…所以…”、“尽管…”、“并且”、“但是”,叫做显式关系识别任务。没有出现关联词,则叫做隐式关系识别任务。前者的识别效果远好于后者的识别效果。当前,隐式关系识别任务主要是对具有语义关系的两个EDU分别建模,然后再交互建本文档来自技高网...

【技术保护点】
1.一种语义关系识别模型的训练方法,其特征在于,包括:将样本数据集输入至初始预训练模型中,输出样本句子的表示信息,所述样本数据集包括多个样本语义单元;获取多个特征词,并将多个特征词进行拼接,得到拼接特征词的表示信息;将所述样本句子的表示信息和所述拼接特征词的表示信息输入至初始分类器中,输出所述样本语义单元之间的语义关系类别;调整所述初始预训练模型以及所述初始分类器,得到新预训练模型和新分类器;根据所述新预训练模型和所述新分类器建立语义关系识别模型。

【技术特征摘要】
1.一种语义关系识别模型的训练方法,其特征在于,包括:将样本数据集输入至初始预训练模型中,输出样本句子的表示信息,所述样本数据集包括多个样本语义单元;获取多个特征词,并将多个特征词进行拼接,得到拼接特征词的表示信息;将所述样本句子的表示信息和所述拼接特征词的表示信息输入至初始分类器中,输出所述样本语义单元之间的语义关系类别;调整所述初始预训练模型以及所述初始分类器,得到新预训练模型和新分类器;根据所述新预训练模型和所述新分类器建立语义关系识别模型。2.根据权利要求1所述的方法,其特征在于,所述样本数据集包括篇章数据集,将样本数据集输入至初始预训练模型中,得到样本句子的表示信息,包括:将篇章数据集输入至深度双向预训练模型中,得到篇章句子向量;根据第一函数系数和所述篇章句子向量进行线性整流处理,得到篇章句子的表示信息。3.根据权利要求2所述的方法,其特征在于,所述样本数据集还包括情感数据集,将样本数据集输入至初始预训练模型中,得到样本句子的表示信息,包括:将情感数据集输入至所述深度双向预训练模型中,得到情感句子向量;根据第二函数系数和所述情感句子向量进行线性整流处理,得到情感句子的表示信息。4.根据权利要求3所述的方法,其特征在于,将所述样本句子的表示信息和所述拼接特征词的表示信息输入至初始分类器中,输出所述样本语义单元之间的语义关系类别,包括:将所述篇章句子的表示信息和所述拼接特征词的表示信息进行拼接,得到第一拼接信息;根据第三函数系数和所述第一拼接信息进行归一化指数处理,得到多个语义关系类别的第一概率分布;对所述第一概率分布和对所述篇章数据集进行独热编码的概率分布进行交叉熵运算,得到第一语义关系类别。5.根据权利要求4所述的方法,其特征在于,将所述样本句子的表示信息和所述拼接特征词的表示信息输入至初始分类器中,输出所述样本语义单元之间的语义关系类别,包括:将所述情感句子的表示信息和所述拼接特征词的表示信息进行拼接,得到第二拼接信息;根据第四函数系数和所述第二拼接信息进行归一化指数处理,得到多个语义关系类别的第二概率分布;对所述第二概率分布和对所述情感数据集进行独热编码的概率分布进行交叉熵运算,得到第二语义关系类别。6.根据权利要求5所述的方法,其特征在于,调整所述初始预训练模型以及所述初始分类器,得到新预训练模型和新分类器,包括:调整所述初始预训练模型的模型参数,以及所述第一函数系数、所述第二函数系数、所述第三函数系数以及所述第四函数系数,得到所述新预训练模型和所述新分类器。7.一种语义关系识别模型的训练装置,其特征在于,包括:样本句子的表示信息获取模块,用于将样本数据集输入至初始预训练模型中,输出样本句子的表示信息,所述样本数据集包括多个样本语义单元;特征词拼接模块,用于获取多个特征词,并将多个特征词进行拼接,得到拼接特征词的...

【专利技术属性】
技术研发人员:高参何伯磊肖欣延
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1