一种面向电信欺诈案件受害者的人格特征检测方法技术

技术编号:36691732 阅读:8 留言:0更新日期:2023-02-27 19:59
本发明专利技术属于人格特征预测领域,具体涉及一种面向电信欺诈案件受害者的人格特征检测方法,包括:对案件文本数据信息进行预处理;利用正则表达式按照预定义的脱敏规则对预处理后的数据信息进行隐私保护处理;建立人格特征检测模型,将隐私保护处理后的数据信息输入人格特征检测模型获取相应的大五人格特征得分。本发明专利技术能够实现对电信欺诈案件受害者的人格特征分析,提高了人格特征检测精度,为电信欺诈案件受害者的人格特征检测提供技术支持。案件受害者的人格特征检测提供技术支持。案件受害者的人格特征检测提供技术支持。

【技术实现步骤摘要】
一种面向电信欺诈案件受害者的人格特征检测方法


[0001]本专利技术属于人格特征预测领域,具体涉及一种面向电信欺诈案件受害者的人格特征检测方法。

技术介绍

[0002][0003]传统刑侦方式从犯罪手段层面进行分析,不利于理解犯罪的案发规律,对欺诈案件的防范具有一定的滞后性。而每位欺诈受害者在被欺诈过程中都有不同的心理特质,从欺诈犯罪心理层面对犯罪行为进行探究,可以深入理解被欺诈时受害者的心理状态。而人格特征是一个人所有行为、动机、思维方式以及情绪的组合特性,对于每个人平时的所做选择以及生活都产生了巨大的影响。通过得到各类案件中受害者的人格特征,能分析出各类型受害者对何种引诱信息具有偏好,进而从普通民众的心理层面采取相应措施防范欺诈案件的发生。目前已有一些研究通过文本信息分析用户人格特征,但是这些研究大多基于词频法,矩阵分解以及主题模型等方法。这些方法的局限性在于检测性能依赖于研究者的先验知识,对于复杂样本的检测缺少可靠性。还有一些研究者提出了基于深度学习的人格特征检测,比如分层CNN模型以及多任务学习等方法。虽然这些方法在精度上有了较大的提升,但是这些方法在不同群体的样本检测中精度差异性较大,存在可解释性较差的情况。

技术实现思路

[0004]为解决上述技术问题,本专利技术提出一种面向电信欺诈案件受害者的人格特征检测方法,包括:
[0005]S1,对案件文本数据信息进行预处理;
[0006]S2,按照预定义的脱敏规则对预处理后的数据信息进行隐私保护处理;
[0007]S3、建立人格特征检测模型,将隐私保护处理后的数据信息输入人格特征检测模型获取相应的大五人格特征得分。
[0008]优选的,对案件文本数据信息进行预处理,包括:利用Python内置的jieba 库对案件文本信息数据进行停用词处理。
[0009]优选的,对数据隐私保护处理,包括:
[0010]S21:建立自定义的脱敏规则;
[0011]所述脱敏规则包括:剔除案件文本信息中的身份证号、电话号码以及住址等用户隐私信息;
[0012]S22:通过建立的脱敏规则对数据信息的文本进行脱敏处理。
[0013]优选的,所述人格特征检测模型,包括:Bert层、多分类层;
[0014]所述多分类层:组合多个二分类器,得到多分类器,并预设五大人格特征,将数据输入多分类器,实现五大人格的分类;
[0015]所述五大人格特征包括:外向性、神经质性、宜人性、尽责性、开放性。
[0016]优选的,将隐私保护处理后的数据信息输入人格特征检测模型获取相应的大五人格特征得分,包括:
[0017]S31:将隐私处理之后的数据信息输入到Bert层中进行文档划分,将数据信息的文档长度大于512的进行截断,文档长度不足512的用无用词填充,并转换为句向量;
[0018]S32:将句向量与Francois Mairesse开发的具有84个特征组成的人格特征检测数据集进行连接,得到整个案件信息的文档特征向量;
[0019]S33:将整个案件信息的文档特征向量输入多分类层,第一层SVM分类器中进行二分类判断,得出人格特征的偏好得分,根据偏好得分判断是否属于五大人格的某种人格特征,如果不是就再输入到下一层SVM中进行相应的判断,直至判断出相应的大五人格特征为止;
[0020]S34:将多分类层的输出的对应人格的人格特征偏好得分取平均数,得到最终的人格特征的偏好得分。
[0021]进一步的,Bert层将数据信息转换为词向量,包括:
[0022]通过从输入数据信息的一句话中提取15%的次进行预测,同时随机抹除部分数据,将这些数据以80%的概率使用特殊符号[MASK]进行替换,10%的概率使用任意词替换,剩下的10%概率保持原词不变,得到将数据信息转化为具有上下文关联的词向量,按顺序将词向量拼接得到每行数据的句向量。
[0023]本专利技术的有益效果:
[0024]1.本专利技术所提出的方法具有较强的可解释性以及可复用性。
[0025]2.相较于现有的人格特征检测模型,本专利技术提高了人格特征检测精度。
附图说明
[0026]图1为本专利技术的整体框图;
[0027]图2为Bert的结构表示图;
[0028]图3为SVM模型的线性分类图;
[0029]图4为数据预处理与脱敏规则流程图。
具体实施方式
[0030]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0031]一种面向电信欺诈案件受害者的人格特征检测方法,如图1所示,包括:
[0032]S1,对案件文本数据信息进行预处理;
[0033]S2,按照预定义的脱敏规则对预处理后的数据信息进行隐私保护处理;
[0034]S3、建立人格特征检测模型,将隐私保护处理后的数据信息输入人格特征检测模型获取相应的大五人格特征得分。
[0035]大五人格:大五人格特征模型是心理学中的一个模型,它包含了五种不同的人格特征,包括EXT(Extroversion,外向性),NEU(Neuroticism,神经质性), AGR
(Agreeableness,宜人性),CON(Conscientiousness,尽责性),OPN (Openness,开放性)。
[0036]开放性(Openness):具有想象、审美、情感丰富、求异、创造、智慧等特质。
[0037]责任心(Conscientiousness):显示胜任、公正、条理、尽职、成就、自律、谨慎、克制等特点。
[0038]外倾性(Extraversion):表现出热情、社交、果断、活跃、冒险、乐观等特质。
[0039]宜人性(Agreeableness):具有信任、利他、直率、依从、谦虚、移情等特质。
[0040]神经质性(Neuroticism):难以平衡焦虑、敌对、压抑、自我意识、冲动、脆弱等情绪的特质,即不具有保持情绪稳定的能力。
[0041]一个人通过大五人格模型的得分在各项上均有不同。例如外向性评分明显较高则表示其喜欢与人接触,充满活力,经常感受到积极的情绪,神经质性得分明显较高则表示其有较大的心理压力,有太多不现实的想法、过多的要求和冲动,更容易体验到诸如愤怒、焦虑、抑郁等消极的情绪。虽然这些得分可能存在例外的情况,但从平均角度来看,开放性得分较高则表示偏爱抽象思维,兴趣广泛。
[0042]文本预处理:是指文字信息输入到人格特征检测模型之前进行规范化处理,使文字数据符合模型的输入要求。
[0043]隐私保护:隐私保护是指使个人或集体等实体不愿被其他人知道的信息得到应有的保护。
[0044]Bert:B本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向电信欺诈案件受害者的人格特征检测方法,其特征在于,包括:S1:对案件文本数据信息进行预处理;S2:按照预定义的脱敏规则对预处理后的数据信息进行隐私保护处理;S3:建立人格特征检测模型,将隐私保护处理后的数据信息输入人格特征检测模型获取相应的大五人格特征得分。2.根据权利要求1所述的一种面向电信欺诈案件受害者的人格特征检测方法,其特征在于,对案件文本数据信息进行预处理,包括:利用Python内置的jieba库对案件文本信息数据进行停用词处理。3.根据权利要求1所述的一种面向电信欺诈案件受害者的人格特征检测方法,其特征在于,对数据隐私保护处理,包括:S21:建立自定义的脱敏规则;所述脱敏规则包括:剔除案件文本信息中的身份证号、电话号码以及住址等用户隐私信息;S22:通过建立的脱敏规则对数据信息的文本进行脱敏处理。4.根据权利要求1所述的一种面向电信欺诈案件受害者的人格特征检测方法,其特征在于,所述人格特征检测模型,包括:Bert层、多分类层;所述多分类层:组合多个二分类器,得到多分类器,并预设五大人格特征,将数据输入多分类器,实现五大人格的分类;所述五大人格特征包括:外向性、神经质性、宜人性、尽责性、开放性。5.根据权利要求1所述的一种面向电信欺诈案件受害者的人格特征检测方法,其特征在于,...

【专利技术属性】
技术研发人员:黄海辉胡锦浩马创刘帅武冉鑫颜莉
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1