一种模型训练方法、文本分类方法及相关设备技术

技术编号:36248663 阅读:37 留言:0更新日期:2023-01-07 09:40
本申请提供一种模型训练方法、文本分类及相关设备获取多个历史客诉文本样本;对每个历史客诉文本样本进行分词处理,得到相应的初始分词序列;利用分词序列模型对初始分词序列进行重组,得到目标分词序列;提取目标分词序列对应的目标词向量,将目标词向量输入文本情感分类模型,以通过文本情感分类模型对目标词向量进行分类处理,计算得到分类结果与目标分类结果的分类准确率,同时以分类结果趋近于目标分类结果为训练目标调节文本情感分类模型的参数,直至文本情感分类模型达到收敛,得到目标文本情感分类模型;利用历史客诉文本样本的分类准确率更新分词序列模型的参数,使得到的目标分词序列模型可以重组出准确度更高的目标分词序列。标分词序列。标分词序列。

【技术实现步骤摘要】
一种模型训练方法、文本分类方法及相关设备


[0001]本专利技术涉及信息安全
,更具体地说,涉及一种模型训练方法、文本分类方法及相关设备。

技术介绍

[0002]随着互联网技术的不断发展,网上购物已经成为了人们的日常,各个网上购物平台为了给客户提供更优质的购物体验,客服服务成为提高购物体验最重要的一环之一,客服服务可以收集用户反馈的问题,通过对用户反馈的问题进行分词处理,可以帮助业务线发现服务中不够完善和不够合理的地方,从而可以完善和提高相关流程。例如,可以账号类客诉中的盗号下单、二次号、风控拦截等问题进行分词处理,找出账号安全中可能存在的问题,从而完善和提高账号安全相关的流程。
[0003]在对文本进行处理的过程中,文本分词处理是文本处理过程中最重要的环节之一。由于英文文本中的各个英文单词之间有空格隔开,通常按照空格便可实现分词,但是中文文本中各个汉字之间没有空格,无法按照空格的方式实现分词,故对中文文本进行分词处理需要将该中文文本的连续字序列按照一定的规范重新组合成词序列。
[0004]现有的分词方法通常为基于字符串匹本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:获取多个历史客诉文本样本;针对每个所述历史客诉文本样本,对所述历史客诉文本样本进行分词处理,得到初始分词序列;利用分词序列模型对所述初始分词序列进行重组,得到目标分词序列;提取所述目标分词序列对应的目标词向量,并将所述目标词向量输入文本情感分类模型,以通过所述文本情感分类模型对所述目标词向量进行分类处理,计算得到分类结果与目标分类结果的分类准确率,同时以所述分类结果趋近于所述目标分类结果为训练目标调节所述文本情感分类模型的参数,直至所述文本情感分类模型达到收敛,得到目标文本情感分类模型;利用所述历史客诉文本样本的分类准确率更新所述分词序列模型的参数。2.根据权利要求1所述的方法,其特征在于,所述初始分词序列包括多个词,所述利用分词序列模型对所述初始分词序列进行重组,得到目标分词序列,包括:利用分词序列模型计算所述初始分词序列中每个目标词组对应的组合概率,将大于预设概率阈值的组合概率对应的所述目标词组中的各个词进行组合,得到目标分词序列;其中,所述目标词组至少包括相邻的两个词。3.根据权利要求1所述的方法,其特征在于,所述分词序列模型为利用Policy Gradients算法构建的分词序列模型。4.根据权利要求1所述的方法,其特征在于,所述提取所述目标分词序列对应的目标词向量,包括:利用词向量提取模型,提取所述目标分词序列对应的目标词向量;其中,所述词向量提取模型为BERT模型,或者为word2vec模型。5.根据权利要求1所述的方法,其特征在于,所述将所述目标词向量输入文本情感分类模型,以通过所述文本情感分类模型对所述目标词向量进行分类处理,计算得到分类结果与目标分类结果的分类准确率,同时以所述分类结果趋近于所述目标分类结果为训练目标调节所述文本情感分类模型的参数,直至所述文本情感分类模型达到收敛,得到目标文本情感分类模型,包括:将所述目标词向量输入文本情感分类模型;通过所述文本情感分类模型对所述目标词向量进行分类处理,计算得到分类结果与目标分类结果的分类准确率;并根据所述分类结果和所述目标分类结果构建相应的损失函数,利用所述损失函数调节所述文本情感分类模型的参数,直至所述文本情感分类模型达到收敛为止,得到目标文本情感分类模型。6.一种文本分类方法,其特征在于,适用于权利要求1

5任一项的模型训练方法训练得到的目标分词序列模型和目标文本情感分类模型,所述方法包括:将客诉文本的初始分词序列输入所述目标分词序列模型中,以使所述目标分词序列模型对所述客诉文本的初始分词序列进行重组,得到所述客诉文本的分词序列;其中,所述初始分词序列是对所述客诉文本进行分词处理得到的;提取所述客诉文本的分词序列的词向量,并将所述词向量输入目标文本情感分类模型,以使所述目标文本情感...

【专利技术属性】
技术研发人员:赵志辉甘广燕沈华林
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1