【技术实现步骤摘要】
一种对话语言模型的训练方法、装置、设备及存储介质
[0001]本专利技术实施例涉及自然语言处理
,尤其涉及一种对话语言模型的训练方法、装置、设备及存储介质。
技术介绍
[0002]随着自然语言的相关技术的飞速发展,出现了越来越多的预训练语言模型,其通常需要在大规模的语料中进行训练。
[0003]目前,主流预训练语言模型有ELMO模型(Deep contextualized word representations,深度语境化词表征)、BERT模型(Bidirectional Encoder Representations from Transformers,基于转换器的双向编码表征)和GPT模型(Gererate Pre
‑
Training,生成式预训练)等。其中,ELMO模型通过长短期记忆网络(LSTM,Long short
‑
term memory),可以同时考虑上下文的信息,解决了多义词的学习,GPT模型的核心思想是,通过二段式的训练,以通用语言模型加微调训练的模式完成预训练任务,BERT模型参考了ELMO模型的双向编码思想,借鉴了GPT用Transformer(特征提取模型)作为训练特征提取器的思路,并采用了连续词袋模型(CBOW,Continuous Bag
‑
of
‑
Words)的训练方法。
[0004]然而,现有的预训练语言模型的训练语料,主要是基于大规模规范的互联网文本语料,其一般是书面语,与现实生活中实际发 ...
【技术保护点】
【技术特征摘要】
1.一种对话语言模型的训练方法,其特征在于,包括:获取对话语料作为训练样本;其中,所述对话语料包括至少两个角色的至少一轮对话,每个角色在一轮会话中的语言文本作为一个文本片段;从所述对话语料中提取语义特征编码、片段特征编码和位置特征编码;将所述语义特征编码、片段特征编码和位置特征编码,输入对话语言模型输出嵌入向量;根据所述嵌入向量,基于非线性角色分类器,输出至少一个文本片段所属的预测角色;根据所述对话语料中文本片段所属的实际角色,与所述预测角色计算角色损失关系;根据所述角色损失关系对所述对话语言模型进行优化训练。2.根据权利要求1所述的方法,其特征在于,从所述对话语料中提取语义特征编码之前,还包括:按照设定掩码处理策略,将所述对话语料中的至少一个设定领域词汇进行掩码处理,以更新所述对话语料中的实际字符为掩码字符;相应的,将所述语义特征编码、片段特征编码和位置特征编码,输入对话语言模型输出嵌入向量之后,还包括:根据所述嵌入向量,基于非线性字符分类器,输出所述对话语料中各字符所对应的预测字符;根据所述对话语料中各字符所对应的实际字符,与所述预测字符,计算字符损失关系;根据所述字符损失关系对所述对话语言模型进行优化训练。3.根据权利要求2所述的方法,其特征在于,根据所述角色损失关系对所述对话语言模型进行优化训练,以及根据所述字符损失关系对所述对话语言模型进行优化训练包括:根据所述角色损失关系和所述字符损失关系,计算总损失关系;根据所述总损失关系对所述对话语言模型进行优化训练。4.根据权利要求2所述的方法,其特征在于,按照设定掩码处理策略,将所述对话语料中的至少一个设定领域词汇进行掩码处理包括:从所述对话语料识别确定设定领域词汇;按照设定掩码处理策略中的选择比例,从所述对话语料中选择符合所述选择比例的词汇,作为待替换词汇,其中,所述设定领域词汇被选为待替换词汇的几率大于非设定领域词汇被选为待替换词汇的几率;若所述待替换词汇中包含所述设定领域词汇,则将所述待替换词汇中的设定领域词汇的一个或多个字符,以符号或文本进行掩码处理,形成掩码字符。5.根据权利要求1所述的方法,其特征在于,将所述语义特征编码、片段特征编码和位置特征编码,输入对话语言模型输出嵌入向量包括:将所述语义特征编码、片段特征编码和位置特征编码,拼接为输入向量;将所述输入向量输入对话语言模型,输出嵌入向量;其中,所述嵌入向量与所述输入向量的字符位置相互对应。6.根据权利要求1
‑
5任一所述的方法,其特征在于:所述语义特征编码用于表征各字符的语义特征,每个字符的语义特征编码记为
将各字符的语义特征编码添加入字符嵌入表,记为E
t
∈R
V
×
d
;其中,e表示一个位置的特征编码,i表示所述对话语料的片段序号,j代表第i个片段中的字符序号,上标t表示语义特征编码,d代表所述对话语料,R表示向量,V表示词表大小;所述片段特征编码用于表征各文本片段的片段顺序特征,每个文本片段的片段特征编码记为将各片段特征编码添加入片段嵌入表,记为E
s
∈R
S
×
d
;其中,S表示所述对话语料的总文本片段数量;上标s表示片段特征编码;所述位置特征编码用于表征各字符的位置特征,每个字符的位置...
【专利技术属性】
技术研发人员:胡岩,郭林海,张琛,万化,
申请(专利权)人:上海浦东发展银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。