样本不均衡条件下的投诉预测方法、装置及存储介质制造方法及图纸

技术编号:37105725 阅读:17 留言:0更新日期:2023-04-01 05:04
本申请公开了一种样本不均衡条件下的投诉预测方法、装置及存储介质,其中该方法,包括:采集用户的相关特征数据,并将采集的相关特征数据分为训练集和测试集,其中训练集中样本的类别分为投诉类和不投诉类;根据训练集中少数类样本的数量K,将述训练集中的多数类样本进行聚类处理,得到与少数类样本的数量对应的K个样本集;基于K个样本集和所述训练集中少数类的K个样本,分别训练N个基分类器,其中基分类器的数量N为根据训练集的不平衡程度和样本数量所确定的;利用训练好的N个基分类器对测试集的每个样本进行预测,并根据N个基分类器的预测结果,确定测试集的每个样本的分类结果,其中分类结果分为投诉和不投诉。其中分类结果分为投诉和不投诉。其中分类结果分为投诉和不投诉。

【技术实现步骤摘要】
样本不均衡条件下的投诉预测方法、装置及存储介质


[0001]本申请涉及信息分类
,特别是涉及一种样本不均衡条件下的投诉预测方法、装置及存储介质。

技术介绍

[0002]随着第三产业的快速发展,以及互联网等数字化技术的应用,如何在科技快速赋能业务的同时保障对用户的服务质量,已经成为了大多企业不得不仔细思考的课题。科技可以让用户得到更加精准、快速、便捷的服务,但同时,用户对服务质量的要求也在逐步提升。随着国家层面对于社会声音的重视,以及互联网的快速发展,表达意见的途径越来越直接有效,如果用户对于企业服务不满意,可以通过媒体平台、监管部门等渠道进行投诉,而企业被投诉对于企业的形象以及竞争力等会产生负面影响,甚至会被监管处罚。例如,对于金融企业来说,国家相关监管部门对于企业被投诉情况会有相应的要求,如果被监管投诉数量超过标准,将会对企业声誉造成影响,甚至会有一定程度处罚。那么,企业就需要在提升自身服务质量的同时,对于可能的投诉进行前置的处理,如果能在用户去监管投诉前及时发现该风险,并介入干预,进行安抚,那么就可以降低用户的监管投诉数量,及时为用户本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种样本不均衡条件下的投诉预测方法,其特征在于,包括:采集用户的相关特征数据,并将采集的相关特征数据分为训练集和测试集,其中所述训练集中样本的类别分为投诉类和不投诉类;根据所述训练集中少数类样本的数量K,将所述训练集中的多数类样本进行聚类处理,得到与所述少数类样本的数量对应的K个样本集;基于所述K个样本集和所述训练集中少数类的K个样本,分别训练N个基分类器;利用训练好的N个基分类器对所述测试集的每个样本进行预测,并根据N个基分类器的预测结果,确定所述测试集的每个样本的分类结果,其中所述分类结果分为投诉和不投诉。2.根据权利要求1所述的方法,其特征在于,基于所述K个样本集和所述训练集中少数类的K个样本,分别训练N个基分类器之前,包括:根据所述训练集的不平衡程度和样本数量,确定基分类器的数量N。3.根据权利要求1所述的方法,其特征在于,基于所述K个样本集和所述训练集中少数类的K个样本,分别训练N个基分类器,包括:从K个样本集中各抽取一个样本,将每次抽取的K个样本与所述训练集中少数类的K个样本组成一个样本组,进行N次抽取后,得到N个样本组;使用N个样本组分别训练N个基分类器。4.根据权利要求3所述的方法,其特征在于,从K个样本集中各抽取一个样本,包括:从所述K个样本集中各随机抽取一个样本;或者从所述K个样本集中各按顺序抽取一个样本。5.根据权利要求1所述的方法,其特征在于,利用训练好的N个基分类器对所述测试集的每个样本进行预测,并根据N个基分类器的预测结果,确定所述测试集的每个样本的分类结果,包括:将训练好的N个基分类器集成为投诉预测模型;将所述测试集的每个样本输入所述投诉预测模型,根据所述投诉预测模型中N个基分类器的预测结果,确定所述测试集的每个样本的分类结果。6.根据权利要求5所述的方法,其特征在于,根据所述投诉预测模型中N个基分类器的分类结果,确定所述测试集的每个样本的分类结果,包括:对于所述测试集的每个样本,统计N个基分类器的不同预测结果的数量;将多数类的预测结果确定为分类结果,得到所述测试集的每个样本的分类结果。7.根据权利...

【专利技术属性】
技术研发人员:李可新曲本盛杜斌钟磊
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1