关键信息处理方法和装置制造方法及图纸

技术编号:18669014 阅读:37 留言:0更新日期:2018-08-14 20:50
本发明专利技术涉及一种关键信息处理方法,包括:获取待处理图片,识别所述待处理图片中的信息;通过机器学习获取识别到的所述待处理图片中的信息中的特征信息;判断预设的关键信息库中是否存在与待处理图片中的特征信息匹配的关键信息;若是,则获取与所述特征信息匹配的关键信息对应的模糊化处理区域和模糊化处理方式;根据所述模糊化处理区域确定与所述特征信息对应的需要进行模糊化处理的区域,根据所述模糊化处理方式对所述区域进行模糊化处理。获取待处理图片中的特征信息,并根据特征信息获取对应的关键信息模糊化处理方式及区域,对待处理图片中的信息进行模糊化处理,能够对待处理图片进行自动化处理,并且能够准确的确定模糊化处理区域。

Key information processing methods and devices

The invention relates to a key information processing method, which comprises: acquiring a picture to be processed, identifying the information in the picture to be processed, acquiring the feature information in the information identified in the picture to be processed by machine learning, and judging whether there is a feature information in the preset key information base and the image to be processed. If so, the fuzzification processing region and the fuzzification processing mode corresponding to the key information matched with the feature information are obtained; the regions corresponding to the feature information that need to be fuzzified are determined according to the fuzzification processing region, and the regions are advanced according to the fuzzification processing mode. Die gelatinization. Get the feature information of the image to be processed, and according to the feature information to obtain the corresponding key information blurring processing methods and regions, blurring the information in the image to be processed, can process the image automatically, and can accurately determine the blurring processing area.

【技术实现步骤摘要】
关键信息处理方法和装置
本专利技术涉及计算机
,特别涉及一种关键信息处理方法和装置。
技术介绍
随着科学技术的不断发展,越来越多的信息被发布在网络上进行交流使用。如为了方便企业的财务监管,需要在企业的金融系统中提交各种证件、发票、文凭复印件或照片等信息,但发布的这些信息中可能包括身份证号、账号等关键信息,如果不加处理的公布在网络系统中,容易造成关键信息的泄漏,给人们生活带来不便。因此,需要在信息发布前对其中的关键信息进行处理。传统的关键信息处理方法是按照尺寸将固定区域的信息作为关键信息区域,对信息进行处理时,对固定区域进行模糊或者遮盖处理,但由于提交的图片大小不同或出现倒置的情况,可能导致对错误区域进行处理,导致关键信息没有被完全处理。也可以通过人工手动的对待发布的图片的关键信息进行处理,但这种方式很难对大量图片进行批量处理,且人工处理也容易造成关键信息的泄漏。因此,传统的关键信息处理方法存在关键信息处理区域不准确或无法批量化处理的问题。
技术实现思路
基于此,有必要针对上述问题,提供一种能够准确确定关键信息区域且能批量化进行处理的关键信息处理方法和装置。一种关键信息处理方法,包括:获取待处理图片,识别所述待处理图片中的信息;通过机器学习获取识别到的所述待处理图片中的信息中的特征信息;判断预设的关键信息库中是否存在与待处理图片中的特征信息匹配的关键信息;若是,则获取与所述特征信息匹配的关键信息对应的模糊化处理区域和模糊化处理方式;根据所述模糊化处理区域确定与所述特征信息对应的需要进行模糊化处理的区域,根据所述模糊化处理方式对所述区域进行模糊化处理。在其中一个实施例中,所述获取待处理图片,识别所述待处理图片中的信息的步骤,包括:获取待处理图片,根据预设规则对所述待处理图片进行区域划分,分别对各个区域中的信息进行识别。在其中一个实施例中,所述通过机器学习获取识别到的所述待处理图片中的信息中的特征信息的步骤,包括:获取识别到的所述待处理图片中的信息,根据机器学习对所述信息进行分词处理;将分词处理的结果与预设匹配词典相匹配;若匹配成功,则提取分词结果中分词信息为所述待处理图片中的特征信息。在其中一个实施例中,所述获取待处理图片,识别所述待处理图片中的信息的步骤之后,还包括:若识别所述待处理图片中的信息识别失败,则对所述待处理图片进行标记存储。在其中一个实施例中,获取待处理图片,识别所述待处理图片中的信息,包括:获取待处理图片,判断所述待处理图片的图片格式是否为预设图片格式;若是,则识别所述待处理图片中的信息;若否,则转换所述待处理图片的图片格式为预设图片格式,然后识别所述待处理图片中的信息。一种关键信息处理装置,包括:识别模块,用于获取待处理图片,识别所述待处理图片中的信息;第一获取模块,用于通过机器学习获取识别到的所述待处理图片中的信息中的特征信息;匹配模块,用于判断预设的关键信息库中是否存在与待处理图片中的特征信息匹配的关键信息;第二获取模块,用于若是,则获取与所述特征信息匹配的关键信息对应的模糊化处理区域和模糊化处理方式;处理模块,用于根据所述模糊化处理区域确定与所述特征信息对应的需要进行模糊化处理的区域,根据所述模糊化处理方式对所述区域进行模糊化处理。在其中一个实施例中,所述识别模块还用于获取待处理图片,根据预设规则对所述待处理图片进行区域划分,分别对各个区域中的信息进行识别。在其中一个实施例中,所述第一获取模块包括:分词模块,用于获取识别到的所述待处理图片中的信息,根据机器学习对所述信息进行分词处理;提取模块,用于将分词处理的结果与预设匹配词典相匹配;若匹配成功,则提取分词结果中分词信息为所述待处理图片中的特征信息。在其中一个实施例中,所述装置还包括:标记存储模块,用于若识别所述待处理图片中的信息识别失败,则对所述待处理图片进行标记存储。在其中一个实施例中,所述识别模块还用于获取待处理图片,判断所述待处理图片的图片格式是否为预设图片格式;若是,则识别所述待处理图片中的信息;若否,则转换所述待处理图片的图片格式为预设图片格式,然后识别所述待处理图片中的信息。上述关键信息处理方法和装置,识别待处理图片中的信息,并利用机器学习获取待处理图片中的信息中的特征信息,通过特征信息与预设的关键信息库中的关键信息相互匹配获取对应的模糊化处理区域和模糊化处理方式,确定待处理图片中需要进行模糊化处理的区域,按照对应的模糊化处理方式进行模糊化处理。利用机器学习获取待处理图片中的特征信息,并根据特征信息获取对应的关键信息模糊化处理方式及区域,从而对待处理图片中需要进行模糊化处理的区域采用对应的模糊化处理方式进行处理,避免了关键信息处理区域不准确或无法批量化处理的问题,能够对待处理图片进行自动化处理,并且能够准确的确定模糊化处理区域。附图说明图1为一个实施例中关键信息处理方法流程图;图2为另一个实施例中关键信息处理方法流程图;图3为一个实施例中机器学习原理图;图4为一个实施例中关键信息模糊化处理的示意图;图5为一个实施例中待处理图片模糊化处理后效果图;图6为一个实施例中关键信息处理装置结构图;图7为另一个实施例中关键信息处理装置结构图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,在一个实施例中,提供了一种关键信息处理方法,具体内容如下:步骤110,获取待处理图片,识别待处理图片中的信息。本实施例中,待处理图片是指将要发布到网络上进行交流使用的图片,待处理图片包括身份证、各种票据、银行卡等重要证件或单据的复印件或扫描件。使用识别算法对待处理图片中的信息进行识别,主要包括文字信息和图片信息。步骤120,通过机器学习获取识别到的待处理图片中的信息中的特征信息。本实施例中,对识别到的待处理图片中的内容进行分析,判断待处理图片中对应的证件类型,然后利用机器学习的结果对待处理图片中的信息进行提取,获取待处理图片中的特征信息。特征信息是指根据机器学习的结果获取的分段信息字符组成的词或者待处理图片中携带的图形信息。步骤130,判断预设的关键信息库中是否存在与待处理图片中的特征信息匹配的关键信息。本实施例中,预先建立关键信息库,如将二代身份证中的姓名、照片、地址以及身份证号码为关键信息存储在关键信息库中;将银行卡中的卡号、有效期、签名等关键信息存储在关键信息库中。本实施例中,将获取的待处理图片中的特征信息与预先建立的关键信息库中的关键信息进行匹配,判断预先建立的关键信息库中是否存在与在待处理图片中提取的特征信息相同的敏感信息。进一步地,为了更好的保护关键信息,预先设置匹配率,即从待处理图片中获取的特征信息与预先建立的敏感信息库中的敏感信息不一定需要完全相同,只要匹配成功满足预先设置的匹配率就认为匹配成功,如提取的特征信息为身份证,敏感信息库中的敏感信息为身份证号,则认为能够匹配。步骤140,若是,则获取与特征信息匹配的关键信息对应的模糊化处理区域和模糊化处理方式。本实施例中,预先针对不同的关键信息建立不同的模糊化处理方式以及模糊化处理区域,如关键字姓名对应的模糊化处理方式为将实际姓名本文档来自技高网...

【技术保护点】
1.一种关键信息处理方法,其特征在于,所述方法包括:获取待处理图片,识别所述待处理图片中的信息;通过机器学习获取识别到的所述待处理图片中的信息中的特征信息;判断预设的关键信息库中是否存在与待处理图片中的特征信息匹配的关键信息;若是,则获取与所述特征信息匹配的关键信息对应的模糊化处理区域和模糊化处理方式;根据所述模糊化处理区域确定与所述特征信息对应的需要进行模糊化处理的区域,根据所述模糊化处理方式对所述区域进行模糊化处理。

【技术特征摘要】
1.一种关键信息处理方法,其特征在于,所述方法包括:获取待处理图片,识别所述待处理图片中的信息;通过机器学习获取识别到的所述待处理图片中的信息中的特征信息;判断预设的关键信息库中是否存在与待处理图片中的特征信息匹配的关键信息;若是,则获取与所述特征信息匹配的关键信息对应的模糊化处理区域和模糊化处理方式;根据所述模糊化处理区域确定与所述特征信息对应的需要进行模糊化处理的区域,根据所述模糊化处理方式对所述区域进行模糊化处理。2.根据权利要求1所述的方法,其特征在于,所述获取待处理图片,识别所述待处理图片中的信息的步骤,包括:获取待处理图片,根据预设规则对所述待处理图片进行区域划分,分别对各个区域中的信息进行识别。3.根据权利要求1所述的方法,其特征在于,所述通过机器学习获取识别到的所述待处理图片中的信息中的特征信息的步骤,包括:获取识别到的所述待处理图片中的信息,根据机器学习对所述信息进行分词处理;将分词处理的结果与预设匹配词典相匹配;若匹配成功,则提取分词结果中分词信息为所述待处理图片中的特征信息。4.根据权利要求1所述的方法,其特征在于,所述获取待处理图片,识别所述待处理图片中的信息的步骤之后,还包括:若识别所述待处理图片中的信息识别失败,则对所述待处理图片进行标记存储。5.根据权利要求1所述的方法,其特征在于,获取待处理图片,识别所述待处理图片中的信息,包括:获取待处理图片,判断所述待处理图片的图片格式是否为预设图片格式;若是,则识别所述待处理图片中的信息;若否,则转换所述待处理图片的图片格式为预设图片格式,然后识...

【专利技术属性】
技术研发人员:陈磊肖聘邹学军
申请(专利权)人:深圳前海明磊融创科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1