一种前置化个人隐私数据识别方法及引擎装置制造方法及图纸

技术编号:36257598 阅读:20 留言:0更新日期:2023-01-07 09:53
本发明专利技术实施例提供了一种前置化个人隐私数据识别方法及系统。该方法对应用程序发起的隐私数据识别请求中携带的参数信息进行合法性校验;在通过合法性校验的情况下,将参数信息中的文本内容作为待识别文本内容,并对待识别文本内容进行修正,得到修正文本内容;从多种隐私数据维度中选取目标数据维度,按照与目标数据维度对应的识别方式对修正文本内容进行个人隐私数据识别,得到与目标数据维度对应的数据识别结果;对数据识别结果按照隐私数据维度进行组合封装。本发明专利技术为防止个人隐私数据识别绕过,可对待识别文本内容进行修正,并按照多种隐私数据维度,对修正文本内容进行隐私数据识别,可以提高隐私数据识别的准确率。可以提高隐私数据识别的准确率。可以提高隐私数据识别的准确率。

【技术实现步骤摘要】
一种前置化个人隐私数据识别方法及引擎装置


[0001]本专利技术涉及数据处理
,特别是涉及一种前置化个人隐私数据识别方法及引擎装置。

技术介绍

[0002]目前,对于个人隐私数据的识别方法通常采用正则表达式完成数据内容的筛选并实施相对简单的校验策略,该方法对于个人隐私数据识别的准确率较低;或客户端通过网络请求的形式将待识别文件内容传输至远程识别中心,识别中心利用机器学习算法完成特征数据的识别,该方法存在因网络传输耗时多、占用带宽资源的问题。因此,设计一个快速、高识别率个人隐私识别装置,对于数据安全治理是十分必要的。

技术实现思路

[0003]本专利技术实施例的目的在于提供一种前置化个人隐私数据识别方法及引擎装置,在客户端(即数据侧)和/或服务器端进行个人隐私数据识别,同时利用内容修正、多层数据校验技术,可以提高个人隐私识别准确率。具体技术方案如下:
[0004]本专利技术提供了一种前置化个人隐私数据识别方法,应用于客户端和/或服务器端,所述方法包括:
[0005]对应用程序发起的隐私数据识别请求中携带的参数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种前置化个人隐私数据识别方法,其特征在于,应用于客户端和/或服务器端,所述方法包括:对应用程序发起的隐私数据识别请求中携带的参数信息进行合法性校验;所述参数信息至少包括文本内容、请求时间戳和签名信息;在通过合法性校验的情况下,将所述文本内容作为待识别文本内容,并对所述待识别文本内容进行修正,得到修正文本内容;从多种隐私数据维度中选取目标数据维度,按照与所述目标数据维度对应的识别方式对所述修正文本内容进行个人隐私数据识别,得到与所述目标数据维度对应的数据识别结果;对所述数据识别结果按照所述隐私数据维度进行组合封装。2.根据权利要求1所述的前置化个人隐私数据识别方法,其特征在于,所述对应用程序发起的隐私数据识别请求中携带的参数信息进行合法性校验,包括:判断所述文本内容的长度是否满足长度限制条件;判断所述请求时间戳与当前时间戳的差值是否在阈值范围内;判断所述签名信息是否合法;在所述文本内容的长度满足所述长度限制条件、所述差值在预设范围内以及所述签名信息合法的情况下,通过合法性校验。3.根据权利要求1所述的前置化个人隐私数据识别方法,其特征在于,所述对所述待识别文本内容进行修正,得到修正文本内容,包括:基于字符删除表,查找所述待识别文本内容中含有的所述字符删除表中的字符,得到第一字符,并将所述第一字符从所述待识别文本内容中删除。4.根据权利要求1所述的前置化个人隐私数据识别方法,其特征在于,所述对所述待识别文本内容进行修正,得到修正文本内容,包括:基于字符替换表,查找所述待识别文本内容中含有的所述字符替换表中的字符,得到第二字符,并查找所述字符替换表中所述第二字符的替换字符,从所述待识别文本中将所述第二字符更换为所述替换字符。5.根据权利要求1所述的前置化个人隐私数据识别方法,其特征在于,所述隐私数据维度包括:地址信息、身份证号、银行卡号、手机号、座机号;所述从多种隐私数据维度中选取目标数据维度,按照与所述目标数据维度对应的识别方式对所述修正文本内容进行个人隐私数据识别,得到与所述目标数据维度对应的数据识别结果,具体包括:从多种隐私数据维度中选取目标数据维度;其中,所述目标数据维度对应地址信息;对所述修正文本内容利用基于省份名称构建的正则表达式进行识别,得到初始地址内容列表;其中,所述初始地址内容列表中包括多个初始地址信息;对所述初始地址内容列表中的初始地址信息采用地址前缀AC自动机进行匹配,将匹配成功的所述初始地址信息作为待校验地址信息;其中,地址前缀至少包括省和地级市名称;对所述待校验地址信息采用特产词汇AC自动机进行匹配,将未匹配成功的所述待校验地址信息作为已校验地址信息;对所述已校验地址信息采用地址常用词AC自动机进行匹配,将匹配成功的所述已校验
地址信息作为与地址信息对应的识别结果。6.根据权利要求5所述的前置化个人隐私数据识别方法,其特征在于,所...

【专利技术属性】
技术研发人员:李奇史晨阳裴亚民黄登玺陈广华李成亮李景灿王晓鹏
申请(专利权)人:中国光大银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1