一种机器人催收获取客户意向标签的多标签分类方法技术

技术编号:28501189 阅读:30 留言:0更新日期:2021-05-19 22:45
本申请公开了一种机器人催收获取客户意向标签的多标签分类方法、装置、设备及介质。该方法包括:基于催收语音数据,并利用自动语音识别技术将催收语音数据转化为文本信息,以得到目标文本数据;对目标文本数据进行纠错处理得到纠错后文本数据;通过注意力机制模块对纠错后文本数据从字、词、句三个维度进行特征提取,以得到对应的字特征、词特征和句子特征;对字特征、词特征和句子特征进行拼接处理得到拼接后特征向量,并将拼接后特征向量输入至预先训练得到的DPCNN模型,以预测出催收语音数据对应的客户意向标签。通过从字、词和句三个角度提取句子信息,并利用DPCNN网络结构多尺度多位置进行深度特征提取,提高了客户意向多标签分类的准确性。签分类的准确性。签分类的准确性。

【技术实现步骤摘要】
一种机器人催收获取客户意向标签的多标签分类方法


[0001]本专利技术涉及自然语言处理领域,特别涉及一种机器人催收获取客户意向标签的多标签分类方法、装置、设备及介质。

技术介绍

[0002]当前,信用卡不良率持续上升,如果贷前风控和贷中跟踪都失效的话,贷后催收就成为最后一道关卡。通常在催收业务可分为人工催收和机器人催收两种方式,人工催收准确率高但也存在着催收效率低,同时不同的催收业务员的素质和态度也需要专门的培训,所以人工催收存在着效率低成本高的缺陷。机器人催收完全按照预定的催收语料模版进行催收工作,且不存在催收态度问题。但是机器人催收同样面临一个问题,对于客户的口音、方言、口语化等话语,机器人可能存在不能正确理解客户意图的问题。
[0003]现有技术中,机器人催收通常利用基于RNN、Bi

LSTM或Seq2Seq等结构的时序循环网络,以及TextCNN卷积网络,但时序循环网络当前时刻的结果依赖于上一时刻的结果,无法进行并行化计算,无法解决长句子中存在梯度消失的问题,且TextCNN卷积网络对于复杂句子难以学习到关键本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种机器人催收获取客户意向标签的多标签分类方法,其特征在于,包括:基于催收语音数据,并利用自动语音识别技术将所述催收语音数据转化为文本信息,以得到目标文本数据;对所述目标文本数据进行纠错处理得到纠错后文本数据;通过注意力机制模块对所述纠错后文本数据从字、词、句三个维度进行特征提取,以得到对应的字特征、词特征和句子特征;对所述字特征、词特征和句子特征进行拼接处理得到拼接后特征向量,并将所述拼接后特征向量输入至预先训练得到的DPCNN模型,以预测出所述催收语音数据对应的客户意向标签。2.根据权利要求1所述的机器人催收获取客户意向标签的多标签分类方法,其特征在于,所述对所述目标文本数据进行纠错处理得到纠错后文本数据,包括:基于所述目标文本数据,利用word2vec模型训练得到表征概率分布的语言模型;通过编辑距离算法计算得到不同词语之间的距离值;利用Adaboost算法,根据通过所述语言模型得到的语义特征以及根据所述距离值确定的权重预测正确文本,以实现对所述目标文本数据的纠错处理。3.根据权利要求1所述的机器人催收获取客户意向标签的多标签分类方法,其特征在于,所述利用注意力机制模块对所述纠错后文本数据从字、词、句三个维度进行特征提取,以得到对应的字特征、词特征和句子特征,包括:利用BERT词嵌入模型,从字、词、句三个维度对所述纠错后文本数据进行向量化操作,以得到字嵌入向量、词嵌入向量和句嵌入向量;将所述字嵌入向量、词嵌入向量和句嵌入向量分别输入注意力机制模块,以得到对应的字特征、词特征和句子特征。4.根据权利要求1至3任一项所述的机器人催收获取客户意向标签的多标签分类方法,其特征在于,所述将所述拼接后特征向量输入至预先训练得到的DPCNN模型,以预测出所述催收语音数据对应的客户意向标签,包括:通过等长卷积对所述拼接后特征向量进行上下文信息压缩,得到目标语义信息;基于所述目标语义信息,通过包含池化层和卷积层的循环网络单元进行深层特征提取,并根据提取的深层特征确定对应的客户意向标签。5.一种机器人催收获取客户意向标签的多标签分类装置,其特征在于,包括:文本数据获取模块,基于催收语音数据,并利用自动语音识别技术将所述催收语音数据转化为文本信息,以得到目标文本...

【专利技术属性】
技术研发人员:李电祥陈学珉毛骏
申请(专利权)人:上海畅圣计算机科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1