图片数据的处理方法及装置、电子设备、存储介质制造方法及图纸

技术编号:37598245 阅读:10 留言:0更新日期:2023-05-18 11:47
本发明专利技术实施例提供了图片数据的处理方法及装置、电子设备、存储介质,涉及图片处理技术领域,所述方法包括:获取图片数据,并对所述图片数据中所包含的图片对象类型进行识别,得到所述图片数据的图片分类结果;对所述图片数据进行文本识别,得到所述图片数据所包含的文本信息;结合上下文语义,确定所述文本信息的文本分类结果,并确定所述文本信息所包含的敏感内容的内容类型标签;结合所述图片分类结果、所述文本分类结果,以及所述内容类型标签,确定所述图片数据的敏感情况分类结果。通过本发明专利技术实施例,实现了对包含文本的图片数据中敏感数据识别的优化,提升了对包含文本的图片数据中敏感数据的识别效果。中敏感数据的识别效果。中敏感数据的识别效果。

【技术实现步骤摘要】
图片数据的处理方法及装置、电子设备、存储介质


[0001]本专利技术涉及图片处理
,特别是涉及图片数据的处理方法及装置、电子设备、存储介质。

技术介绍

[0002]在信息化、数字化时代,数据的类型不断增多,体量飞速增长,数据已经成为重要的生产要素。随着数字经济的迅猛发展,数据安全风险也随之凸显,特别是敏感数据的泄露问题,对个人权益造成影响。
[0003]目前,主流的敏感数据识别主要应用于结构化数据,而对于图片类的非结构化数据,特别是对于包含文本的图片类数据中敏感数据识别效果不佳。

技术实现思路

[0004]鉴于上述问题,提出了以便提供克服上述问题或者至少部分地解决上述问题的图片数据的处理方法及装置、电子设备、存储介质,包括:
[0005]一种图片数据的处理方法,所述方法包括:
[0006]获取图片数据,并对所述图片数据中所包含的图片对象类型进行识别,得到所述图片数据的图片分类结果;
[0007]对所述图片数据进行文本识别,得到所述图片数据所包含的文本信息;
[0008]结合上下文语义,确定所述文本信息的文本分类结果,并确定所述文本信息所包含的敏感内容的内容类型标签;
[0009]结合所述图片分类结果、所述文本分类结果,以及所述内容类型标签,确定所述图片数据的敏感情况分类结果。
[0010]可选地,还包括:
[0011]根据所述敏感情况分类结果,对所述图片数据进行脱敏处理。
[0012]可选地,所述结合所述图片分类结果、所述文本分类结果,以及所述内容类型标签,确定所述图片数据的敏感情况分类结果,包括:
[0013]获取预先定义的权重系数;
[0014]按照所述权重系数,对所述图片分类结果、所述文本分类结果,以及所述内容类型标签进行加权,确定所述图片数据的敏感情况分类结果。
[0015]可选地,所述确定所述文本信息所包含的敏感内容的内容类型标签,包括:
[0016]获取预先定义的候选内容类型;
[0017]按照所述候选内容类型,对所述文本信息所包含的敏感内容进行识别,得到所包含的敏感内容的内容类型标签。
[0018]可选地,所述候选内容类型包括以下任一项或多项:
[0019]姓名、手机号、邮箱、地址。
[0020]可选地,所述结合上下文语义,确定所述文本信息的文本分类结果,包括:
[0021]将所述文本信息输入预先训练的深度神经网络模型,以由所述深度神经网络模型结合上下文语义,确定所述文本信息的文本分类结果。
[0022]可选地,所述对所述图片数据进行文本识别,得到所述图片数据所包含的文本信息,包括:
[0023]采用光学字符识别技术,对所述图片数据进行文本识别,得到所述图片数据所包含的文本信息。
[0024]可选地,所述采用光学字符识别技术,对所述图片数据进行文本识别,得到所述图片数据所包含的文本信息,包括:
[0025]对所述图片数据进行文本检测,确定文字区域;
[0026]对所述文字区域进行文本识别,得到所述图片数据所包含的文本信息。
[0027]可选地,所述对所述图片数据中所包含的图片对象类型进行识别,得到所述图片数据的图片分类结果,包括:
[0028]将所述图片数据输入预先训练的卷积神经网络模型,以由所述卷积神经网络模型对所述图片数据中所包含的图片对象类型进行识别;
[0029]获取所述卷积神经网络模型针对所述图片数据输出的图片分类结果。
[0030]可选地,所述图片分类结果包括以下任一项:
[0031]证件类型图片、非法类型图片。
[0032]可选地,在对所述图片数据中所包含的对象类型进行识别,得到所述图片数据的图片分类结果之前,还包括:
[0033]对所述图片数据进行预处理。
[0034]可选地,所述对所述图片数据进行预处理,包括:
[0035]对所述图片数据进行降噪处理。
[0036]一种图片数据的处理装置,所述装置包括:
[0037]图片分类结果得到模块,用于获取图片数据,并对所述图片数据中所包含的图片对象类型进行识别,得到所述图片数据的图片分类结果;
[0038]文本信息得到模块,用于对所述图片数据进行文本识别,得到所述图片数据所包含的文本信息;
[0039]文本分类结果和内容类型标签确定模块,用于结合上下文语义,确定所述文本信息的文本分类结果,并确定所述文本信息所包含的敏感内容的内容类型标签;
[0040]敏感情况分类结果确定模块,用于结合所述图片分类结果、所述文本分类结果,以及所述内容类型标签,确定所述图片数据的敏感情况分类结果。
[0041]一种电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的图片数据的处理方法。
[0042]一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的图片数据的处理的方法。
[0043]本专利技术实施例具有以下优点:
[0044]在本专利技术实施例中,通过获取图片数据,并对所述图片数据中所包含的图片对象类型进行识别,得到所述图片数据的图片分类结果,对所述图片数据进行文本识别,得到所
述图片数据所包含的文本信息,结合上下文语义,确定所述文本信息的文本分类结果,并确定所述文本信息所包含的敏感内容的内容类型标签,结合所述图片分类结果、所述文本分类结果,以及所述内容类型标签,确定所述图片数据的敏感情况分类结果,实现了对包含文本的图片数据中敏感数据识别的优化,不仅结合图片类型还结合文本类型来进行敏感数据的识别,提升了对包含文本的图片数据中敏感数据的识别效果。
附图说明
[0045]为了更清楚地说明本专利技术的技术方案,下面将对本专利技术的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0046]图1a是本专利技术一实施例提供的一种系统架构的示意图;
[0047]图1b是本专利技术一实施例提供的一种卷积神经网络处理的示意图;
[0048]图1c是本专利技术一实施例提供的一种图片文字识别的示意图;
[0049]图1d是本专利技术一实施例提供的一种BERT及BiLSTM的文本分类的示意图;
[0050]图2是本专利技术一实施例提供的一种图片数据的处理方法的步骤流程图;
[0051]图3是本专利技术一实施例提供的另一种图片数据的处理方法的步骤流程图;
[0052]图4是本专利技术一实施例提供的另一种图片数据的处理方法的步骤流程图;
[0053]图5是本专利技术一实施例提供的一种图片数据的处理装置的结构框图。
具体实施方式
[0054]为使本专利技术的上述目的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图片数据的处理方法,其特征在于,所述方法包括:获取图片数据,并对所述图片数据中所包含的图片对象类型进行识别,得到所述图片数据的图片分类结果;对所述图片数据进行文本识别,得到所述图片数据所包含的文本信息;结合上下文语义,确定所述文本信息的文本分类结果,并确定所述文本信息所包含的敏感内容的内容类型标签;结合所述图片分类结果、所述文本分类结果,以及所述内容类型标签,确定所述图片数据的敏感情况分类结果。2.根据权利要求1所述的方法,其特征在于,还包括:根据所述敏感情况分类结果,对所述图片数据进行脱敏处理。3.根据权利要求1所述的方法,其特征在于,所述结合所述图片分类结果、所述文本分类结果,以及所述内容类型标签,确定所述图片数据的敏感情况分类结果,包括:获取预先定义的权重系数;按照所述权重系数,对所述图片分类结果、所述文本分类结果,以及所述内容类型标签进行加权,确定所述图片数据的敏感情况分类结果。4.根据权利要求1至3任一项所述的方法,其特征在于,所述确定所述文本信息所包含的敏感内容的内容类型标签,包括:获取预先定义的候选内容类型;按照所述候选内容类型,对所述文本信息所包含的敏感内容进行识别,得到所包含的敏感内容的内容类型标签。5.根据权利要求4所述的方法,其特征在于,所述候选内容类型包括以下任一项或多项:姓名、手机号、邮箱、地址。6.根据权利要求1至3任一项所述的方法,其特征在于,所述结合上下文语义,确定所述文本信息的文本分类结果,包括:将所述文本信息输入预先训练的深度神经网络模型,以由所述深度神经网络模型结合上下文语义,确定所述文本信息的文本分类结果。7.根据权利要求1所述的方法,其特征在于,所述对所述图片数据进行文本识别,得到所述图片数据所包含的文本信息,包括:采用光学字符识别技术,对所述图片数据进行文本识别,得到所述图片数据所包含的文本信息。8.根据权利要求7所述的方法,其特征在于,所述采用光学字符识别技术,对所述图片数据进行文本识别,得到所述图片数据所包含的文本信息,...

【专利技术属性】
技术研发人员:刘羽琦刘志党胡冲黄鑫辰富惠翀
申请(专利权)人:天翼云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1