异常用户的识别方法、装置、设备及存储介质制造方法及图纸

技术编号:32130106 阅读:11 留言:0更新日期:2022-01-29 19:27
本发明专利技术涉及大数据技术,揭露了一种异常用户的识别方法,包括:采集历史投诉工单信息,提取诉求详情,得到多个用户的诉求详情文本;提取每个所述诉求详情文本中的关键词,并基于所述关键词生成第一异常用户集;基于所述历史投诉工单信息获取多个所述用户的设备信息,根据多个所述用户的设备信息和预设的设备信息条件生成第二异常用户集;获取基于用户信息构建用户知识图谱,从所述用户知识图谱中识别生成第三异常用户集,得到异常用户集。此外,本发明专利技术还涉及区块链技术,历史投诉工单信息可存储于区块链的节点。本发明专利技术还提出一种异常用户的识别装置、电子设备以及存储介质。本发明专利技术可以提高异常用户的识别效率。高异常用户的识别效率。高异常用户的识别效率。

【技术实现步骤摘要】
异常用户的识别方法、装置、设备及存储介质


[0001]本专利技术涉及大数据
,尤其涉及一种异常用户的识别方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着社会的发展,人们对生活质量的要求越来越高,对于各种服务的要求也越来越高,一旦有不满意就会产生投诉。如有的客户因为对银行的服务态度、收费问题等感到不满,而对银行提出投诉。但是有些异常用户为了达到自己的经济目的而恶意的投诉银行,违约还款、甚至不还,委托第三方投诉银行,这种行为可能会严重影响银行的正常业务。
[0003]而对于这种异常用户,目前主要是通过人工查看工单内容,听取录音,判定是否为黑产用户,这种方法耗时耗力,效率低下且差错率较高,因此,需要一种可以高效的识别异常用户的方法。

技术实现思路

[0004]本专利技术提供一种异常用户的识别方法、装置及计算机可读存储介质,其主要目的在于提高异常用户的识别效率。
[0005]为实现上述目的,本专利技术提供的一种异常用户的识别方法,包括:
[0006]采集历史投诉工单信息,从所述历史投诉工单信息中提取诉求详情,得到多个用户的诉求详情文本;
[0007]提取每个所述诉求详情文本中的关键词,并基于所述关键词生成第一异常用户集;
[0008]基于所述历史投诉工单信息获取多个所述用户的设备信息,根据多个所述用户的设备信息和预设的设备信息条件生成第二异常用户集;
[0009]获取基于用户信息构建的用户知识图谱,根据所述第一异常用户集和所述第二异常用户集从所述用户知识图谱中识别生成第三异常用户集,并与所述第一异常用户集、所述第二异常用户集汇总得到异常用户集。
[0010]可选地,所述提取每个所述诉求详情文本中的关键词,包括:
[0011]将每个所述诉求详情文本切分成词,得到每个所述诉求详情文本对应的词语集;
[0012]计算每个所述词语集中每个词语的词频和逆向文件频率;
[0013]根据所述词频和所述逆向文件频率计算每个词语的权重;
[0014]将每个所述词语集中的词语按照所述权重从大到小进行排序,并选择排名前预设阈值个数的词语,得到每个所述诉求详情文本中的关键词。
[0015]可选地,所述计算每个所述词语集中每个词语的词频,包括:
[0016]分别统计每个词语在对应的诉求详情文本中出现的次数,得到出现次数;
[0017]统计所述词语集中所有词语的数量,得到总词数量;
[0018]根据所述出现次数和所述总词数量,利用预设第一公式生成每个词语的词频。
[0019]可选地,所述计算每个所述词语集中每个词语的逆向文件频率,包括:
[0020]统计所述词语集对应的诉求详情文本的总数量,得到总文档数量;
[0021]对所述词语集中每个词语,统计包含所述词语的诉求详情文本的数量,得到含词条文档数量;
[0022]根据所述总文档数量和所述含词条文档数量,利用预设第二公式计算生成每个词语的逆向文件频率。
[0023]可选地,所述设备信息包括用户提交投诉工单时所用设备的账号信息、电量、图片数量中的一项或多项,所述根据多个所述用户的设备信息和预设的设备信息条件生成第二异常用户集,包括:
[0024]若多个所述用户的设备信息中存在任一设备信息满足预设的设备信息条件,将所述任一设备信息对应的用户判断为异常用户,确定得到的所有异常用户组成第二异常用户集。
[0025]可选地,所述获取基于用户信息构建的用户知识图谱之前,所述方法还包括:
[0026]将各个所述用户作为实体,并以所述实体为知识图谱的节点;
[0027]提取所述历史投诉工单信息中的用户信息作为各实体的属性;
[0028]分析所述实体之间的关联关系,并根据所述实体的属性以及实体之间的关联关系构建多个三元组;
[0029]将所述多个三元组进行可视化,得到用户知识图谱。
[0030]可选地,所述根据所述第一异常用户集和所述第二异常用户集从所述用户知识图谱中识别生成第三异常用户集,并与所述第一异常用户集、所述第二异常用户集汇总得到异常用户集,包括:
[0031]将所述第一异常用户集和所述第二异常用户集中的用户在所述用户知识图谱中进行标记;
[0032]在所述用户知识图谱中查找与所述第一异常用户集和所述第二异常用户集中的异常用户具有相同电话属性的其余用户,并将所述其余用户标记为异常用户,得到第三异常用户集;
[0033]汇总所述第一异常用户集、第二异常用户集及第三异常用户集,得到异常用户集,并对所述异常用户集的用户进行转移处理。
[0034]为了解决上述问题,本专利技术还提供一种异常用户的识别装置,所述装置包括:
[0035]文本采集模块,采集历史投诉工单信息,从所述历史投诉工单信息中提取诉求详情,得到多个用户的诉求详情文本;
[0036]关键词提取模块,用于提取每个所述诉求详情文本中的关键词,并基于所述关键词生成第一异常用户集;
[0037]设备信息获取模块,用于基于所述历史投诉工单信息获取多个所述用户的设备信息,根据多个所述用户的设备信息和预设的设备信息条件生成第二异常用户集;
[0038]异常用户生成模块,用于获取基于用户信息构建的用户知识图谱,根据所述第一异常用户集和所述第二异常用户集从所述用户知识图谱中识别生成第三异常用户集,并与所述第一异常用户集、所述第二异常用户集汇总得到异常用户集。
[0039]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0040]至少一个处理器;以及,
[0041]与所述至少一个处理器通信连接的存储器;其中,
[0042]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的异常用户的识别方法。
[0043]为了解决上述问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的异常用户的识别方法。
[0044]本专利技术实施例从历史投诉工单信息中提取诉求详情,保证了信息完整性;从诉求详情文本提取出关键词,将根据关键词和预先配置好的规则匹配,识别出第一异常用户,同时通过设备信息识别出第二异常用户,可以减少因查看诉求详情文本耗费的时间,有效提高效率;基于用户信息构建用户知识图谱,直接以用户为实体,更加直观清晰,便于获取异常用户信息。因此本专利技术提出的异常用户的识别方法、装置、电子设备及计算机可读存储介质,可以提高异常用户的识别效率。
附图说明
[0045]图1为本专利技术一实施例提供的异常用户的识别方法的流程示意图;
[0046]图2为本专利技术一实施例提供的提取关键词的流程示意图;
[0047]图3为本专利技术一实施例提供的异常用户的识别装置的功能模块图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常用户的识别方法,其特征在于,所述方法包括:采集历史投诉工单信息,从所述历史投诉工单信息中提取诉求详情,得到多个用户的诉求详情文本;提取每个所述诉求详情文本中的关键词,并基于所述关键词生成第一异常用户集;基于所述历史投诉工单信息获取多个所述用户的设备信息,根据多个所述用户的设备信息和预设的设备信息条件生成第二异常用户集;获取基于用户信息构建的用户知识图谱,根据所述第一异常用户集和所述第二异常用户集从所述用户知识图谱中识别生成第三异常用户集,并与所述第一异常用户集、所述第二异常用户集汇总得到异常用户集。2.如权利要求1所述的异常用户的识别方法,其特征在于,所述提取每个所述诉求详情文本中的关键词,包括:将每个所述诉求详情文本切分成词,得到每个所述诉求详情文本对应的词语集;计算每个所述词语集中每个词语的词频和逆向文件频率;根据所述词频和所述逆向文件频率计算每个词语的权重;将每个所述词语集中的词语按照所述权重从大到小进行排序,并选择排名前预设阈值个数的词语,得到每个所述诉求详情文本中的关键词。3.如权利要求2所述的异常用户的识别方法,其特征在于,所述计算每个所述词语集中每个词语的词频,包括:分别统计每个词语在对应的诉求详情文本中出现的次数,得到出现次数;统计所述词语集中所有词语的数量,得到总词数量;根据所述出现次数和所述总词数量,利用预设第一公式生成每个词语的词频。4.如权利要求2所述的异常用户的识别方法,其特征在于,所述计算每个所述词语集中每个词语的逆向文件频率,包括:统计所述词语集对应的诉求详情文本的总数量,得到总文档数量;对所述词语集中每个词语,统计包含所述词语的诉求详情文本的数量,得到含词条文档数量;根据所述总文档数量和所述含词条文档数量,利用预设第二公式计算生成每个词语的逆向文件频率。5.如权利要求1所述的异常用户的识别方法,其特征在于,所述设备信息包括用户提交投诉工单时所用设备的账号信息、电量、图片数量中的至少一项,所述根据多个所述用户的设备信息和预设的设备信息条件生成第二异常用户集,包括:若多个所述用户的设备信息中存在任一设备信息满足预设的设备信息条件,将所述任一设备信息对应的用户判断为异常用户,确定得到的所有异常用户组成第二异常用户集。6.如权利要求1所述的异常用户的识别方法,其特...

【专利技术属性】
技术研发人员:李兴辉李骁陈杭王亮高洪喜许海金张宇川
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1