【技术实现步骤摘要】
合同文件敏感数据的脱敏方法及系统
[0001]本申请涉及互联网
,特别是涉及一种合同文件敏感数据的脱敏方法及系统。
技术介绍
[0002]数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。
[0003]在企业内部,经常会存在一些合同、协议数据文件需要传输、查阅的场景,但合同本身存在较多敏感信息,包括企业的信息、联系方式、账号信息等,并不是所有场景都需要了解合同的全部内容,当公司非法务人员需求进行查阅时经常要层层审批,而参与审批环节的人员并不一定了解原始查阅需求,可能出现审批内容与需求内容不符,或者提供多于需求的内容等情况,可以将合同中对于企业比较敏感的信息进行数据脱敏处理,简化审批流程,同时也避免放大需求多提供敏感数据的情况。
[0004]现有技术可以使用通用的分词技术或者规则匹配,获取敏感信息,然后进行 ...
【技术保护点】
【技术特征摘要】
1.一种合同文件敏感数据的脱敏方法,其特征在于,包括:合同类别识别步骤,用于获取待识别的合同文件并识别所述合同文件的所属合同类别;内容模块识别步骤,用于基于所述合同类别识别所述合同文件中的多个内容模块;敏感信息识别步骤,用于识别每一所述内容模块中敏感信息,并对所述敏感信息关联对应的预设脱敏规则;脱敏合同获取步骤,用于根据所述脱敏规则对所述敏感信息进行数据脱敏处理,并生成脱敏合同文件。2.根据权利要求1所述的合同文件敏感数据的脱敏方法,其特征在于,所述合同类别识别步骤进一步包括:合同名称识别步骤,用于识别所述合同文件的合同名称并将所述合同名称与预先定义的合同类别进行匹配,以获取所述合同文件所属的合同类别。3.根据权利要求1或2所述的合同文件敏感数据的脱敏方法,其特征在于,所述合同类别识别步骤进一步包括:内容单元识别步骤,用于通过解析所述合同文件的合同内容获取所述合同内容的内容单元,通过匹配内容获取所述内容单元对应的内容模块,根据所述内容模块获取所述合同文件所属的合同类别。4.根据权利要求3所述的合同文件敏感数据的脱敏方法,其特征在于,所述脱敏规则通过一敏感数据表进行存储,所述敏感数据列表至少包括敏感信息及其对应的脱敏方式。5.根据权利要求4所述的合同文件敏感数据的脱敏方法,其特征在于,所述脱敏方式进一步包括:遮蔽脱敏、保格式脱敏、Hash脱敏及变换脱敏其一或其任意组合。6.一种合同文...
【专利技术属性】
技术研发人员:黄山姗,
申请(专利权)人:上海明略人工智能集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。