【技术实现步骤摘要】
工单类别识别方法、模型训练方法、装置和设备
[0001]本公开涉及计算机文本类别识别技术,尤其涉及一种工单类别识别方法、模型训练方法、装置和设备。
技术介绍
[0002]随着电信行业的快速发展,通信运营商提供给用户的服务日益丰富,用户使用量也越来越大,业务场景越来越复杂。当用户在使用服务时遇到如上网、通话、办理业务等问题,就会到营业厅或拨打客服热线进行投诉,再由客服人员把问题派给后台相应专岗技术人员处理。
[0003]现有技术中,通过人工方式阅读、识别工单的文本内容后,再通过人工对工单进行分类,并转派给相应的技术人员处理。
[0004]但是,这种方式无法满足日益发展的数据量要求,效率和准确率都较低,进而导致用户的用户体验较差。
技术实现思路
[0005]本公开提供了一种工单类别识别方法工单类别识别方法、模型训练方法、装置和设备,以解决现有技术中因为通过人工方式阅读、识别工单的文本内容后,再通过人工对工单进行分类,并转派给相应的技术人员处理,无法满足日益发展的数据量要求,效率和准确率都较低,进而 ...
【技术保护点】
【技术特征摘要】
1.一种工单类别识别方法,其特征在于,包括:获取待识别工单文本数据,将所述待识别工单文本数据输入至预设的基于ERNIE2的工单匹配模型中,得到并显示与所述待识别工单文本数据相似的历史工单文本数据;获取修改后的工单文本数据,其中,所述修改后的工单文本数据为基于与所述待识别工单文本数据相似的历史工单文本数据,对所述待识别工单文本数据进行修改后所得到的;将所述修改后的工单文本数据输入至预设的基于ERNIE2的工单分类模型中,得到所述待识别工单文本数据的工单类别。2.根据权利要求1所述的方法,其特征在于,将所述待识别工单文本数据输入至预设的基于ERNIE2的工单匹配模型中,得到并显示与所述待识别工单文本数据相似的历史工单文本数据,包括:将所述待识别工单文本数据输入至预设的基于ERNIE2的工单匹配模型中,得到所述待识别工单文本数据的特征向量,并将历史数据库中的历史工单文本数据输入至预设的基于ERNIE2的工单匹配模型中,得到所述历史工单文本数据的特征向量;根据所述待识别工单文本数据的特征向量、以及所述历史工单文本数据的特征向量,确定所述待识别工单文本数据与所述历史工单文本数据之间的相似度;确定相似度排名为前N个的历史工单文本数据,为与所述待识别工单文本数据相似的历史工单文本数据;其中,N为大于等于1的正整数;显示与所述待识别工单文本数据相似的历史工单文本数据。3.根据权利要求2所述的方法,其特征在于,根据所述待识别工单文本数据的特征向量、以及所述历史工单文本数据的特征向量,确定所述待识别工单文本数据与所述历史工单文本数据之间的相似度,包括;确定所述待识别工单文本数据的特征向量、以及所述历史工单文本数据的特征向量之间的余弦相似性,得到所述待识别工单文本数据与所述历史工单文本数据之间的相似度。4.根据权利要求1所述的方法,其特征在于,在获取修改后的工单文本数据之后,还包括:根据预设的停用词表,其中,所述停用词表中包括多个停用词,对所述修改后的工单文本数据进行匹配,以去除所述修改后的工单文本中的与所述停用词表中停用词相同的词语。5.根据权利要求1
‑
4任一项所述的方法,其特征在于,所述基于ERNIE2的工单匹配模型为去除了所述基于ERNIE2的工单分类模型中的SOFTMAX层的模型,所述基于ERNIE2的工单匹配模型中具有相似度处理模块。6.一种应用于工单类别识别的模型训练方法,其特征在于,包括:获取待训练集合,其中,所述待训练集合中包括多个历史工单文本数据,所述待训练集合中的每一历史工单文本数据具有初始工单类别;重复以下步骤,直至达到预设条件,其中,达到所述预设条件后得到基于ERNIE2的工单分类模型:将所述历史工单文本数据输入至初始模型中,得到所述历史工单文本数据的预测工单类别;根据所述历史工单文本数据的初始工单类别和预测工单类别,调整所述初始模型的参数;
其中,所述基于ERNIE2的工单分类模型用于对修改后的工单文本数据进行识别,得到工单类别;所述修改后的工单文本数据为基于与待识别工单文本数据相似的历史工单文本数据,对所述待识别工单文本数据进行修改后所得到的;与所述待识别工单文本数据相似的历史工单文本数据为将所述待识别工单文本数据输入至预设的基于ERNIE2的工单匹配模型中所得到的。7.根据权利要求6所述的方法,其特征在于,在将所述历史...
【专利技术属性】
技术研发人员:李家明,王楷波,沈治廷,朱峰炜,王健,
申请(专利权)人:中国联合网络通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。