【技术实现步骤摘要】
敏感信息识别方法、装置、电子设备及存储介质
[0001]本申请涉及计算机
,尤其涉及一种用于应用系统的敏感信息识别方法和装置
、
一种用于跨境线上交易系统的隐私信息识别方法和装置
、
电子设备及存储介质
。
技术介绍
[0002]在网络监管日益严格的背景下,对于网上交易等场景中的敏感信息或隐私数据的保护程度日渐提升
。
在应用服务数据的采集
、
传输
、
加工
、
存储
、
使用等全生命周期中,需要将数据纳入合规监管,以保护用户的敏感信息的安全
。
因此,如何精准识别到数据中的敏感信息,显得尤为重要
。
[0003]但是,相关技术中对于敏感信息的识别方式,通常只针对表格形式的文本数据进行简单
、
机械的等同匹配,例如仅提取表格中的关键词,认为含有预设关键词的数据就是敏感信息,且通常需要人工介入,存在可以识别的文本数据类型有限
、
识别准确度不高
、
无法实现自动化识别
、
识别效率低等弊端
。
技术实现思路
[0004]本申请实施例提供一种用于应用系统的敏感信息识别方法和装置
、
一种用于跨境线上交易系统的隐私信息识别方法和装置
、
电子设备及存储介质,以解决上述一个或多个技术问题
。
[0005]第一方面,本申请实施例提供了一 ...
【技术保护点】
【技术特征摘要】
1.
一种用于应用系统的敏感信息识别方法,包括:从与应用系统关联的数据存储空间,获取所述应用系统执行应用服务流程的过程中产生的多种应用服务数据;识别所述应用服务数据的文本结构化程度,并根据所述应用服务数据对应的文本结构化程度,分别确定对所述应用服务数据进行敏感信息识别时使用的至少一种数据识别引擎,所述数据识别引擎对应执行至少一种识别规则;使用所确定的至少一种数据识别引擎对所述应用服务数据进行敏感信息识别
。2.
根据权利要求1所述的方法,其中,所述识别所述应用服务数据的文本结构化程度包括:查找所述应用服务数据对应的文件格式;根据所述应用服务数据对应的文件格式确定所述应用服务数据的文本结构化程度,所述文本结构化程度包括简单结构文本
、
复杂结构文本或非结构化文本
。3.
根据权利要求1所述的方法,其中,所述根据所述应用服务数据对应的文本结构化程度,分别确定对所述应用服务数据进行敏感信息识别时使用的至少一种数据识别引擎包括:在所述应用服务数据对应的文本结构化程度为简单结构文本的情况下,确定对应使用精准识别引擎进行敏感信息识别,所述精准识别引擎包括使用敏感信息的信息标签和
/
或信息值对所述应用服务数据进行敏感信息识别
。4.
根据权利要求1所述的方法,其中,所述根据所述应用服务数据对应的文本结构化程度,分别确定对所述应用服务数据进行敏感信息识别时使用的至少一种数据识别引擎包括:在所述应用服务数据对应的文本结构化程度为复杂结构文本的情况下,对所述应用服务数据进行文本结构简化处理,所述文本结构简化处理包括抽取所述应用服务数据中的特定文本结构;对进行文本结构简化处理的应用服务数据,确定对应使用精准识别引擎和
/
或模式识别引擎进行敏感信息识别,所述精准识别引擎包括使用敏感信息的信息标签和
/
或信息值对所述应用服务数据进行识别,所述模式识别引擎包括使用正则表达式对所述应用服务数据进行敏感信息识别
。5.
根据权利要求1所述的方法,其中,所述根据所述应用服务数据对应的文本结构化程度,分别确定对所述应用服务数据进行敏感信息识别时使用的至少一种数据识别引擎包括:在所述应用服务数据对应的文本结构化程度为非结构化文本的情况下,确定对应使用算法识别引擎进行敏感信息识别,所述算法识别引擎包括调用至少一种预先训练的敏感信息识别算法对所述应用服务数据进行敏感信息识别
。6.
根据权利要求1所述的方法,其中,所述使用所确定的至少一种数据识别引擎对所述应用服务数据进行敏感信息识别包括:在执行各数据识别引擎对所述应用服务数据进行敏感信息识别时,针对所述数据识别引擎对应执行至少一种识别规则,分别创建对应执行线程,所述执行线程并行执行或是串行执行;
调用所述执行线程按照识别规则进行敏感信息识别
。7.
...
【专利技术属性】
技术研发人员:潘灏,金宇,高鹏翔,
申请(专利权)人:杭州阿里巴巴海外互联网产业有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。