【技术实现步骤摘要】
数据处理方法、装置、可读介质及电子设备
[0001]本公开涉及数据处理
,具体地,涉及一种数据处理方法、装置、可读介质及电子设备。
技术介绍
[0002]目前,随着网络的发展以及数据量的增多,具有对待保护信息进行数据保护处理的需求,其中,待保护信息例如包括身份证号、手机号码等用户个人信息,数据保护处理是指对待保护信息通过一定的处理规则进行数据的变形,以对这些信息进行替换或隐藏,实现数据的可靠保护,避免信息泄露。数据保护处理技术可以实现对信息的有效保护,提高数据安全性,其应用越来越广泛,然而相关技术中对信息进行数据保护处理时,容易出现误处理的情况,导致对信息的数据保护处理不够准确。
技术实现思路
[0003]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0004]第一方面,本公开提供一种数据处理方法,所述方法包括:获取待处理文本;确 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取待处理文本;确定所述待处理文本中的目标关键词;获取所述目标关键词的特征信息,其中,所述特征信息用于表征所述目标关键词是否为有依赖关键词,所述有依赖关键词指的是依赖于预设的被依赖词的关键词;根据所述特征信息,确定是否需要对所述目标关键词对应的文本内容中的待保护信息进行数据保护处理;在确定需要对所述待保护信息进行数据保护处理的情况下,对所述待保护信息进行数据保护处理,以得到处理后的目标文本。2.根据权利要求1所述的方法,其特征在于,所述确定所述待处理文本中的目标关键词,包括:获取第一字典树,其中,所述第一字典树是根据至少一个预设关键词构建的;根据所述第一字典树,从所述待处理文本中确定与所述至少一个预设关键词相匹配的匹配关键词以及所述匹配关键词在所述待处理文本中的位置信息;根据所述匹配关键词和所述位置信息,确定所述目标关键词。3.根据权利要求2所述的方法,其特征在于,所述根据所述匹配关键词和所述位置信息,确定所述目标关键词,包括:在所述匹配关键词有多个、且各个所述匹配关键词分别在所述待处理文本中的位置信息均不同的情况下,将所述匹配关键词作为所述目标关键词;在所述匹配关键词有多个、且存在位置信息相同的所述匹配关键词的情况下,将多个所述匹配关键词中除位置信息相同的所述匹配关键词以外的其他匹配关键词、以及位置信息相同的所述匹配关键词中字符数最多的所述匹配关键词,作为所述目标关键词。4.根据权利要求1所述的方法,其特征在于,所述根据所述特征信息,确定是否需要对所述目标关键词对应的文本内容中的待保护信息进行数据保护处理,包括:在所述特征信息表征所述目标关键词为无依赖关键词的情况下,确定需要对所述待保护信息进行数据保护处理;在所述特征信息表征所述目标关键词为有依赖关键词的情况下,确定所述目标关键词所依赖的被依赖词在所述待处理文本中是否存在,在存在的情况下,确定需要对所述待保护信息进行数据保护处理。5.根据权利要求4所述的方法,其特征在于,所述确定所述目标关键词所依赖的被依赖词在所述待处理文本中是否存在,包括:获取所述目标关键词对应的第二字典树,其中,所述第二字典树是根据所述目标关键词所依赖的被依赖词构建的;根据所述第二字典树和所述待处理文本,确定所述目标关键词所依赖的被依赖词在所述待处理文本中是否存在。6.根据权利要求1所述的方法,其特征在于,在所述对所述待保护信息进行数据保护处理的步骤之前,还包括:获取所述待处理文本中从所述目标关键词之后的第一个字符起至第一目标字符之间的第一文本内容,其中,在所述目标关键词不为所述待处理文本中最后一个目标关键词的
情况下,所述第一目标字符为下一目标关键词之前的...
【专利技术属性】
技术研发人员:雷利博,
申请(专利权)人:北京有竹居网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。