【技术实现步骤摘要】
异常用户的识别方法、装置、设备及存储介质
[0001]本专利技术涉及大数据
,尤其涉及一种异常用户的识别方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]随着社会的发展,人们对生活质量的要求越来越高,对于各种服务的要求也越来越高,一旦有不满意就会产生投诉。如有的客户因为对银行的服务态度、收费问题等感到不满,而对银行提出投诉。但是有些异常用户为了达到自己的经济目的而恶意的投诉银行,违约还款、甚至不还,委托第三方投诉银行,这种行为可能会严重影响银行的正常业务。
[0003]而对于这种异常用户,目前主要是通过人工查看工单内容,听取录音,判定是否为黑产用户,这种方法耗时耗力,效率低下且差错率较高,因此,需要一种可以高效的识别异常用户的方法。
技术实现思路
[0004]本专利技术提供一种异常用户的识别方法、装置及计算机可读存储介质,其主要目的在于提高异常用户的识别效率。
[0005]为实现上述目的,本专利技术提供的一种异常用户的识别方法,包括:
[0006]采集历史投诉工单 ...
【技术保护点】
【技术特征摘要】
1.一种异常用户的识别方法,其特征在于,所述方法包括:采集历史投诉工单信息,从所述历史投诉工单信息中提取诉求详情,得到多个用户的诉求详情文本;提取每个所述诉求详情文本中的关键词,并基于所述关键词生成第一异常用户集;基于所述历史投诉工单信息获取多个所述用户的设备信息,根据多个所述用户的设备信息和预设的设备信息条件生成第二异常用户集;获取基于用户信息构建的用户知识图谱,根据所述第一异常用户集和所述第二异常用户集从所述用户知识图谱中识别生成第三异常用户集,并与所述第一异常用户集、所述第二异常用户集汇总得到异常用户集。2.如权利要求1所述的异常用户的识别方法,其特征在于,所述提取每个所述诉求详情文本中的关键词,包括:将每个所述诉求详情文本切分成词,得到每个所述诉求详情文本对应的词语集;计算每个所述词语集中每个词语的词频和逆向文件频率;根据所述词频和所述逆向文件频率计算每个词语的权重;将每个所述词语集中的词语按照所述权重从大到小进行排序,并选择排名前预设阈值个数的词语,得到每个所述诉求详情文本中的关键词。3.如权利要求2所述的异常用户的识别方法,其特征在于,所述计算每个所述词语集中每个词语的词频,包括:分别统计每个词语在对应的诉求详情文本中出现的次数,得到出现次数;统计所述词语集中所有词语的数量,得到总词数量;根据所述出现次数和所述总词数量,利用预设第一公式生成每个词语的词频。4.如权利要求2所述的异常用户的识别方法,其特征在于,所述计算每个所述词语集中每个词语的逆向文件频率,包括:统计所述词语集对应的诉求详情文本的总数量,得到总文档数量;对所述词语集中每个词语,统计包含所述词语的诉求详情文本的数量,得到含词条文档数量;根据所述总文档数量和所述含词条文档数量,利用预设第二公式计算生成每个词语的逆向文件频率。5.如权利要求1所述的异常用户的识别方法,其特征在于,所述设备信息包括用户提交投诉工单时所用设备的账号信息、电量、图片数量中的至少一项,所述根据多个所述用户的设备信息和预设的设备信息条件生成第二异常用户集,包括:若多个所述用户的设备信息中存在任一设备信息满足预设的设备信息条件,将所述任一设备信息对应的用户判断为异常用户,确定得到的所有异常用户组成第二异常用户集。6.如权利要求1所述的异常用户的识别方法,其特...
【专利技术属性】
技术研发人员:李兴辉,李骁,陈杭,王亮,高洪喜,许海金,张宇川,
申请(专利权)人:平安银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。