图像风险文本处理方法、装置、设备和存储介质制造方法及图纸

技术编号:38822607 阅读:15 留言:0更新日期:2023-09-15 20:01
本申请涉及一种图像风险文本处理方法,涉及人工智能领域。所述方法包括:获取金融业务文本图像,并将金融业务文本图像输入至预先构建的文本识别模型,通过文本识别模型中的文本特征获取层,得到金融业务文本图像中包含的字符单元对应的文本内容特征;将文本内容特征输入至文本识别模型中的区域特征获取层,得到字符单元对应的文本区域特征;将文本区域特征输入至文本识别模型中的文本识别层,得到金融业务文本图像中包含的文本字符;基于文本字符,从金融业务文本图像中识别出风险文本区域,并对风险文本区域进行脱敏处理,得到脱敏处理后的金融业务文本图像。采用本方法能够完整准确地对金融业务文本图像中的风险文本进行处理。地对金融业务文本图像中的风险文本进行处理。地对金融业务文本图像中的风险文本进行处理。

【技术实现步骤摘要】
图像风险文本处理方法、装置、设备和存储介质


[0001]本申请涉及人工智能领域,特别是涉及一种图像风险文本处理方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着人工智能领域的发展,出现了一种金融业务图片风险信息自动识别方法,该技术通过采用传统的光学字符识别技术(OCR)来识别图像中的字符文本,进而识别出图片中的风险信息,并对图片中的风险信息进行处理。
[0003]在上述技术方案中,图片里的很多信息是由客户手写的,导致图片中的字体格式不统一,出现手写体和印刷体混杂的场景,该场景下,使用传统的光学字符识别技术无法准确地识别出图像中的字符文本内容,使得图片中的风险信息无法得到完整准确处理。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够完整准确地对金融业务文本图像中的风险文本进行处理的图像风险文本处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种图像风险文本处理方法。所述方法包括:
[0006]获取金融业务文本图像,并将所述金融业务文本图像输入至预先构建的文本识别模型,通过所述文本识别模型中的文本特征获取层,得到所述金融业务文本图像中包含的字符单元对应的文本内容特征;
[0007]将所述文本内容特征输入至所述文本识别模型中的区域特征获取层,得到所述字符单元对应的文本区域特征;
[0008]将所述文本区域特征输入至所述文本识别模型中的文本识别层,得到所述金融业务文本图像中包含的文本字符;
[0009]基于所述文本字符,从所述金融业务文本图像中识别出风险文本区域,并对所述风险文本区域进行脱敏处理,得到脱敏处理后的金融业务文本图像。
[0010]在其中一个实施例中,所述将所述文本内容特征输入至所述文本识别模型中的区域特征获取层,得到所述字符单元对应的文本区域特征,包括:将所述文本内容特征输入至所述区域特征获取层,通过所述区域特征获取层获取所述字符单元对应的字符单元位置区域;将所述字符单元位置区域与所述文本内容特征进行叠加,得到所述字符单元对应的文本区域特征。
[0011]在其中一个实施例中,所述字符单元的数量为多个;所述将所述文本区域特征输入至所述文本识别模型中的文本识别层,得到所述金融业务文本图像中包含的文本字符,包括:将各所述字符单元分别对应的文本区域特征输入至所述文本识别层,通过所述文本识别层得到各所述字符单元之间的位置相关度;根据各所述字符单元分别对应的文本区域特征、各所述字符单元之间的位置相关度,以及所述文本识别层的模型参数,得到所述金融
业务文本图像中包含的文本字符。
[0012]在其中一个实施例中,所述通过所述文本识别层得到各所述字符单元之间的位置相关度,包括:通过所述文本识别层,从各所述字符单元对应的文本区域特征中,获取各所述字符单元对应的目标文本区域特征;根据各所述字符单元对应的目标文本区域特征,得到各所述字符单元之间的距离信息;基于各所述字符单元之间的距离信息,得到各所述字符单元之间的位置相关度。
[0013]在其中一个实施例中,所述通过所述文本识别模型中的文本特征获取层,得到所述金融业务文本图像中包含的字符单元对应的文本内容特征,包括:通过所述文本特征获取层,对所述金融业务文本图像进行多尺度的文本内容特征提取,得到所述金融业务文本图像对应的多个初始文本内容特征;按照预先设定的叠加概率,将所述多个初始文本特征进行叠加,得到所述字符单元对应的文本内容特征。
[0014]在其中一个实施例中,所述基于所述文本字符,从所述金融业务文本图像中识别出风险文本区域,包括:通过预先设置的金融业务知识图谱对所述文本字符进行检索,得到所述文本字符对应的检索结果;基于所述检索结果,识别出所述金融业务文本图像中的风险文本字符,并将所述风险文本字符所在区域作为所述金融业务文本图像中的风险文本区域。
[0015]在其中一个实施例中,所述对所述风险文本区域进行脱敏处理,得到脱敏处理后的金融业务文本图像,包括:将所述风险文本区域进行模糊处理,并从模糊处理后的风险文本区域的像素点中选取出预设数量的目标像素点;将所述目标像素点的颜色更改为预设颜色,得到所述脱敏处理后的金融业务文本图像。
[0016]第二方面,本申请还提供了一种图像风险文本处理装置。所述装置包括:
[0017]文本内容特征获取模块,用于获取金融业务文本图像,并将所述金融业务文本图像输入至预先构建的文本识别模型,通过所述文本识别模型中的文本特征获取层,得到所述金融业务文本图像中包含的字符单元对应的文本内容特征;
[0018]文本区域特征获取模块,用于将所述文本内容特征输入至所述文本识别模型中的区域特征获取层,得到所述字符单元对应的文本区域特征;
[0019]文本字符获取模块,用于将所述文本区域特征输入至所述文本识别模型中的文本识别层,得到所述金融业务文本图像中包含的文本字符;
[0020]文本图像脱敏模块,用于基于所述文本字符,从所述金融业务文本图像中识别出风险文本区域,并对所述风险文本区域进行脱敏处理,得到脱敏处理后的金融业务文本图像。
[0021]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0022]获取金融业务文本图像,并将所述金融业务文本图像输入至预先构建的文本识别模型,通过所述文本识别模型中的文本特征获取层,得到所述金融业务文本图像中包含的字符单元对应的文本内容特征;
[0023]将所述文本内容特征输入至所述文本识别模型中的区域特征获取层,得到所述字符单元对应的文本区域特征;
[0024]将所述文本区域特征输入至所述文本识别模型中的文本识别层,得到所述金融业
务文本图像中包含的文本字符;
[0025]基于所述文本字符,从所述金融业务文本图像中识别出风险文本区域,并对所述风险文本区域进行脱敏处理,得到脱敏处理后的金融业务文本图像。
[0026]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0027]获取金融业务文本图像,并将所述金融业务文本图像输入至预先构建的文本识别模型,通过所述文本识别模型中的文本特征获取层,得到所述金融业务文本图像中包含的字符单元对应的文本内容特征;
[0028]将所述文本内容特征输入至所述文本识别模型中的区域特征获取层,得到所述字符单元对应的文本区域特征;
[0029]将所述文本区域特征输入至所述文本识别模型中的文本识别层,得到所述金融业务文本图像中包含的文本字符;
[0030]基于所述文本字符,从所述金融业务文本图像中识别出风险文本区域,并对所述风险文本区域进行脱敏处理,得到脱敏处理后的金融业务文本图像。
[0031]第五方面,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像风险文本处理方法,其特征在于,所述方法包括:获取金融业务文本图像,并将所述金融业务文本图像输入至预先构建的文本识别模型,通过所述文本识别模型中的文本特征获取层,得到所述金融业务文本图像中包含的字符单元对应的文本内容特征;将所述文本内容特征输入至所述文本识别模型中的区域特征获取层,得到所述字符单元对应的文本区域特征;将所述文本区域特征输入至所述文本识别模型中的文本识别层,得到所述金融业务文本图像中包含的文本字符;基于所述文本字符,从所述金融业务文本图像中识别出风险文本区域,并对所述风险文本区域进行脱敏处理,得到脱敏处理后的金融业务文本图像。2.根据权利要求1所述的方法,其特征在于,所述将所述文本内容特征输入至所述文本识别模型中的区域特征获取层,得到所述字符单元对应的文本区域特征,包括:将所述文本内容特征输入至所述区域特征获取层,通过所述区域特征获取层获取所述字符单元对应的字符单元位置区域;将所述字符单元位置区域与所述文本内容特征进行叠加,得到所述字符单元对应的文本区域特征。3.根据权利要求2所述的方法,其特征在于,所述字符单元的数量为多个;所述将所述文本区域特征输入至所述文本识别模型中的文本识别层,得到所述金融业务文本图像中包含的文本字符,包括:将各所述字符单元分别对应的文本区域特征输入至所述文本识别层,通过所述文本识别层得到各所述字符单元之间的位置相关度;根据各所述字符单元分别对应的文本区域特征、各所述字符单元之间的位置相关度,以及所述文本识别层的模型参数,得到所述金融业务文本图像中包含的文本字符。4.根据权利要求3所述的方法,其特征在于,所述通过所述文本识别层得到各所述字符单元之间的位置相关度,包括:通过所述文本识别层,从各所述字符单元对应的文本区域特征中,获取各所述字符单元对应的目标文本区域特征;根据各所述字符单元对应的目标文本区域特征,得到各所述字符单元之间的距离信息;基于各所述字符单元之间的距离信息,得到各所述字符单元之间的位置相关度。5.根据权利要求1所述的方法,其特征在于,所述通过所述文本识别模型中的文本特征获取层,得到所述金融业务文本图像中包含的字符单元对应的文本内容特征,包括:通过所述文本特征获取层,对所述金融业务文本图像进行...

【专利技术属性】
技术研发人员:邓维李琦梁莉娜王小红
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1