一种融合意图识别降噪的催款话术挖掘方法及装置制造方法及图纸

技术编号:37108673 阅读:22 留言:0更新日期:2023-04-01 05:07
本申请提供了一种融合意图识别降噪的催款话术挖掘方法及装置,该方法包括:收集至少一坐席执行外呼任务时的历史外呼记录并提取坐席应答文本数据,形成原始数据集;建立坐席意图识别模型,利用原始数据集训练坐席意图识别模型;利用训练好的坐席意图识别模型对原始数据集中的各坐席应答文本数据进行意图识别,从原始数据集中筛选出与催收话术关联的目标应答文本数据;对进行目标应答文本数据无监督聚类,得到与催收话术匹配的关键词句;基于与催收话术匹配的关键词句生成催款话术模板。本申请通过意图识别模型区分坐席意图,再叠加文本挖掘模型总结话术特征,通过自动化方案降低了数据噪音,挖掘了数据价值。挖掘了数据价值。挖掘了数据价值。

【技术实现步骤摘要】
一种融合意图识别降噪的催款话术挖掘方法及装置


[0001]本申请涉及人脸识别
,特别是涉及一种融合意图识别降噪的催款话术挖掘方法及装置。

技术介绍

[0002]传统的贷款业务的主要渠道为银行,银行通过一系列的资质审核,配合抵押、担保等手段来保障放款能在规定的时间按时收回获取利息,即便无法按时收回,也可通过抵押物、担保人等减少损失,但这样的业务审批流程较长、门槛较高,对于资质不够高、急需资金、额度需求不高的借款需求无法满足。随着金融创新不断加深、扩大内需等背景下,个人信贷业务也在逐渐从传统银行,转向建立专业化的个人消费金融系统,许多消费金融公司也开始从试点走向逐步开放。
[0003]消费金融公司具有单笔授信额度小、审批速度快、无需抵押担保、服务方式灵活、贷款期限短等独特优势。而这种优势带来的是比传统银行抵押贷款更高的逾期风险,用户群体的下沉、减少审批环节提升审批速度,都会使得放款公司的贷后催收承担更大的压力,如何针对这种灵活贷款通过催收尽可能多的催回款项是一个重要的课题。

技术实现思路

[0004]本申请的目的在于克本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种融合意图识别降噪的催款话术挖掘方法,包括:收集至少一坐席执行外呼任务时的历史外呼记录,将所述历史外呼记录转换为历史对话文本数据后,从所述历史对话文本数据中提取坐席应答文本数据,形成原始数据集;建立坐席意图识别模型,利用所述原始数据集训练所述坐席意图识别模型;利用训练好的坐席意图识别模型对所述原始数据集中的各坐席应答文本数据进行意图识别,从所述原始数据集中筛选出与催收话术关联的目标应答文本数据;对所述进行目标应答文本数据无监督聚类,得到与所述催收话术匹配的关键词句;基于与所述催收话术匹配的关键词句生成催款话术模板。2.根据权利要求1所述的方法,其特征在于,所述建立坐席意图识别模型,利用所述原始数据集训练所述坐席意图识别模型包括:基于神经网络建立坐席意图识别模型;对所述原始数据集进行文本预处理,并基于经过预处理后的原始数据集抽取训练集、验证集、测试集;利用所述训练集对所述坐席意图识别模型进行模型训练,同时利用所述验证集和所述测试集进行训练优化,得到训练好的坐席意图识别模型。3.根据权利要求2所述的方法,其特征在于,所述利用所述训练集对所述坐席意图识别模型进行模型训练包括:基于预训练模型对所述训练集中的文本数据进行向量化,得到对应所述训练集中各文本数据的文本向量;将所述训练集中各文本数据的文本向量输入所述预训练模型中的神经网络层,进行特征的抽象;将抽象过的特征输入Softmax层,利用激活函数映射出的意图分类结果与真实结果进行损失计算,通过优化损失函数进行模型训练。4.根据权利要求2所述的方法,其特征在于,所述对所述原始数据集进行文本预处理包括:对所述原始数据集中包含的坐席应答文本数据进行文本纠错、去停用词的预处理。5.根据权利要求1所述的方法,其特征在于,所述对所述进行目标应答文本数据无监督聚类,得到与所述催收话术匹配的关键词句包括:对各所述目标应答文本数据进行句向量表示,以形成句向量表示数据集合;自定义聚类类别数,对句向量数据集合进行K...

【专利技术属性】
技术研发人员:李可新曲本盛杜斌钟磊
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1