【技术实现步骤摘要】
对话文本标签识别模型训练方法、对话文本标签识别方法
[0001]本公开的实施例涉及计算机
,具体涉及对话文本标签识别模型训练方法、对话文本标签识别方法。
技术介绍
[0002]目前,为了预测用户与客服之间对话内容的标签(意图),通常采用的方式为:利用LSTM(Long Short
‑
Term Memory,长短期记忆网络)时序建模,通过LSTM多次迭代计算得到预测结果,使用最后一次迭代结果作为标签预测结果。
[0003]然而,采用上述方式通常存在以下技术问题:利用LSTM时序建模,无法并行预测用户与客服之间对话内容的标签,存在梯度爆炸的问题,造成标签预测结果的准确率较低。
技术实现思路
[0004]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0005]本公开的一些实施例提出了对话文本标签识别模型训练方法、对话文 ...
【技术保护点】
【技术特征摘要】
1.一种对话文本标签识别模型训练方法,包括:获取目标领域的标注对话文本组,其中,所述标注对话文本组中的标注对话文本包括对话信息序列;对于所述标注对话文本组中的每个标注对话文本,根据所述标注对话文本包括的对话信息序列对应的各个对话角色,对所述标注对话文本包括的对话信息序列进行标识处理,以生成标识后的标注对话文本作为标注对话样本;基于所生成的各个标注对话样本,对预训练对话文本标签识别模型进行训练,得到训练后的预训练对话文本标签识别模型作为对话文本标签识别模型。2.根据权利要求1所述的方法,其中,所述各个对话角色中的对话角色对应所述对话信息序列中的对话信息;以及所述根据所述标注对话文本包括的对话信息序列对应的各个对话角色,对所述标注对话文本包括的对话信息序列进行标识处理,以生成标识后的标注对话文本作为标注对话样本,包括:根据所述各个对话角色,对所述对话信息序列进行聚类处理,以生成对话信息组序列;对于所述对话信息组序列中的每个对话信息组,执行如下处理步骤:确定所述对话信息组对应的对话角色的角色标识,其中,所述对话信息组中的对话信息具有排列顺序;在所述对话信息组的起始位置添加所述角色标识,以对所述对话信息组进行更新;在更新后的对话信息组中的每两个对话信息之间添加对话分割标识;将添加完成后的标注对话文本样本确定为标识对话文本样本。3.根据权利要求1所述的方法,其中,所述获取目标领域的标注对话文本组,包括:获取目标领域的待标注对话文本集;对所述待标注对话文本集进行脱敏处理,以生成脱敏待标注对话文本集;对所述脱敏待标注对话文本集进行数据清洗处理,以生成清洗待标注对话文本集;对所述清洗待标注对话文本集中的每个清洗待标注对话文本进行标注处理,以生成清洗标注对话文本,得到清洗标注对话文本集;对所述清洗标注对话文本集进行数据检验处理,得到数据检验后的清洗标注对话文本集作为标注对话文本组。4.根据权利要求3所述的方法,其中,所述对所述清洗标注对话文本集进行数据检验处理,得到数据检验后的清洗标注对话文本集作为标注对话文本组,包括:根据预设的随机数种子组和所述清洗标注对话文本集,生成清洗标注对话文本组集组,其中,所述随机数种子组中的各个随机数种子不同,所述随机数种子组中的随机数种子对应所述清洗标注对话文本组集组中的清洗标注对话文本组集;对于所述清洗标注对话文本组集组中的每个清洗标注对话文本组集,根据所述清洗标注对话文本组集和初始对话文本预测模型,生成对应所述清洗标注对话文本组集的预测结果;响应于所生成的各个预测结果满足预设检验条件,将所述清洗标注对话文本集确定为标注对话文本组。5.根据权利要求4所述的方法,其中,所述根据所述清洗标注对话文本组集和初始对话
文本预测模型,生成对应所述清洗标注对话文本组集的预测结果,包括:对于所述清洗标注对话文本组集中的每个清洗标注对话文本组,执行如下处理步骤:将所述清洗标注对话文本组确定为测试对话文本组;基于训练标注对话文本组集,对所述初始对话文本预测模型进行训练,得到训练完成的初始对话文本预测模型作为对话文本预测模型,其中,所述训练标注对话文本组集为:所述清洗标注对话文本组集中除所述清洗标注对话文本组之外的各个清洗标注对话文本组;将所述测试对话文本组输入至所述对话文本预测模型中,得到测试对话文本预测结果;将所生成的各个测试对话文本预测结果组合为预测结果。6.根据权利要求4所述的方法,其中,所述根据预设的随机数种子组和所述清洗标注对话文本集,生成清洗标注对话文本组集组,包括:基于所述随机数种子组中的每个随机数种子,通过所述随机数种子对所述清洗标注对话文本集进行划分,以生成清洗标注对话文本组集;将所生成的各个清洗标注对话文本组集确定为清洗标注对话文本组集组。7.根据权利要求1所述的方法,其中,所述基于所生成的各个标注对话样本,对预训练对话文本标签识别模型进行训练,得到训练后的预训练对话文本标签识别模型作为对话文本标签识别模型,包括:从所述各个标注对话样本中选择标注对话样本,其中,所述标注对话样本包括对话样本和对应所述对话样本的对话标签;将第一标识添加至所述对话样本的起始位置,以及将第二标识添加至所述对话样本的末尾位置;对添加完成的对话样本进行位置编码处理,以生...
【专利技术属性】
技术研发人员:周孝青,宫礼星,李家东,黄英凡,赵嘉文,李勇,包勇军,颜伟鹏,
申请(专利权)人:北京京东世纪贸易有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。