图像信息提取方法和装置、电子设备、存储介质制造方法及图纸

技术编号:39400496 阅读:12 留言:0更新日期:2023-11-19 15:53
本申请提出的图像信息提取方法和装置、电子设备、存储介质,涉及人工智能技术领域及数字医疗领域。包括:获取第一图像,并获取第一图像的类别,得到目标图像类别;根据目标图像类别获取第二图像;根据预设尺寸对第一图像进行第一切分,得到至少两个第一区域;根据预设尺寸对第二图像进行第二切分,得到至少两个第二区域;将第一区域和第二区域输入至预设注意力模型进行语义学习,得到第三区域;根据第三区域进行拼接,得到目标掩模图像;根据目标掩模图像对第一图像进行图像分割,得到目标信息区域;对目标信息区域进行文字识别,得到目标文字信息。本申请提高了图像信息的提取效率。本申请提高了图像信息的提取效率。本申请提高了图像信息的提取效率。

【技术实现步骤摘要】
图像信息提取方法和装置、电子设备、存储介质


[0001]本申请涉及人工智能
及数字医疗领域,尤其涉及一种图像信息提取方法和装置、电子设备、存储介质。

技术介绍

[0002]在智能医疗或保险业务过程中,需要对证件、表单等材料中的姓名、性别、出生年月、客户编号等信息进行核实。相关技术采用的核实方法是,先通过文字识别技术(例如OCR技术)识别出整个图像中所有的文字信息,然后再使用自然语言处理算法(例如NLP算法)从所有的文字信息中得到核实信息。
[0003]但是,上述核实方法的缺点是需要对整个图像进行文字识别,不仅十分影响文字识别的效率,也会导致识别出大量不需要的文字信息。另外,利用自然语言处理算法从所有识别出的文字信息提取出核实信息,也会因存在大量不需要的文字信息导致提取效率较低。
[0004]可见,相关技术的核实方法对图像信息提取的效率较低。

技术实现思路

[0005]本申请实施例的主要目的在于提出图像信息提取方法和装置、电子设备、存储介质,能够提高图像信息的提取效率。
[0006]为实现上述目的,本申请实施例的第一方面提出了一种图像信息提取方法,所述方法包括:
[0007]获取第一图像,并获取所述第一图像的类别,得到目标图像类别;
[0008]根据所述目标图像类别获取第二图像;
[0009]根据预设尺寸对所述第一图像进行第一切分,得到至少两个第一区域;其中,每一所述第一区域的尺寸为所述预设尺寸;
[0010]根据所述预设尺寸对所述第二图像进行第二切分,得到至少两个第二区域,其中,每一所述第二区域的尺寸为所述预设尺寸;
[0011]将所述第一区域和所述第二区域输入至预设注意力模型进行语义学习,得到第三区域;
[0012]根据所述第三区域进行拼接,得到目标掩模图像;
[0013]根据所述目标掩模图像对所述第一图像进行图像分割,得到目标信息区域;
[0014]对所述目标信息区域进行文字识别,得到目标文字信息。
[0015]可选地,至少两个第一区域的数量为第一数量,至少两个第二区域的数量为第二数量;所述将所述第一区域和所述第二区域输入至预设注意力模型进行语义学习,得到第三区域,包括:
[0016]将所述第一数量的所述第一区域和所述第二数量的所述第二区域输入至预设注意力模型进行语义学习,得到第三数量的候选区域,其中所述第三数量是所述第一数量与
所述第二数量之和;
[0017]根据预设顺序从所述第三数量的所述候选区域取出所述第一数量的所述候选区域,得到所述第一数量的所述第三区域。
[0018]可选地,所述预设注意力模型包括权重卷积层和第一卷积层;所述将所述第一数量的所述第一区域和所述第二数量的所述第二区域输入至预设注意力模型进行语义学习,得到第三数量的候选区域,包括:
[0019]将所述第一数量的所述第一区域轮流作为第一目标区域;
[0020]通过所述第一卷积层对所述第一目标区域进行第一卷积,得到第一参考向量;
[0021]通过所述权重卷积层对所述第一目标区域和所述第二数量的所述第二区域进行卷积,得到所述第二数量的注意力权重;
[0022]根据所述第二数量的所述注意力权重,对所述第一参考向量进行加权和,得到所述候选区域。
[0023]可选地,所述权重卷积层包括第二卷积层和第三卷积层;所述通过所述权重卷积层对所述第一目标区域和所述第二数量的所述第二区域进行卷积,得到所述第二数量的注意力权重,包括:
[0024]通过所述第二卷积层对所述第一目标区域进行第二卷积,得到第二参考向量;
[0025]通过所述第三卷积层对所述第二数量的所述第二区域进行第三卷积,得到所述第二数量的第三参考向量;
[0026]将所述第二参考向量与所述第二数量的所述第三参考向量各自的乘积进行归一化处理,得到所述第二数量的所述注意力权重。
[0027]可选地,所述根据所述目标图像类别获取第二图像,包括:
[0028]根据所述目标图像类别确定目标信息提取类型;
[0029]根据所述目标信息提取类型构建所述第二图像。
[0030]可选地,所述根据所述目标信息提取类型构建所述第二图像,包括:
[0031]根据所述目标信息提取类型从所述预设数据库提取获取目标字段;
[0032]根据所述目标字段生成所述第二图像。
[0033]可选地,在所述将所述第一区域和所述第二区域输入至预设注意力模型进行语义学习,得到第三区域之前,所述方法还包括:
[0034]训练所述预设注意力模型,具体包括:
[0035]构建样本集,所述样本集中的样本包括第一样本图像、第二样本图像、和标签掩模图像;
[0036]根据预设样本尺寸对所述第一样本图像进行第一样本切分,得到至少两个第一样本区域;其中,每一所述第一样本区域的尺寸为所述预设样本尺寸;
[0037]根据所述预设样本尺寸对所述第二样本图像进行第二样本切分,得到至少两个第二样本区域,其中,每一所述第二样本区域的尺寸为所述预设样本尺寸;
[0038]将所述第一样本区域和所述第二样本区域输入至初始注意力模型进行语义学习,得到第三样本区域;
[0039]根据所述第三样本区域进行拼接,得到样本掩模图像;
[0040]计算所述标签掩模图像和所述样本掩模图像之间的图像差,确定损失数据;
[0041]根据所述损失数据对所述初始注意力模型的参数进行调整,得到所述预设注意力模型。
[0042]为实现上述目的,本申请实施例的第二方面提出了一种图像信息提取装置,所述装置包括:
[0043]第一图像获取模块,用于获取第一图像,并获取所述第一图像的类别,得到目标图像类别;
[0044]第二图像获取模块,用于根据所述目标图像类别获取第二图像;
[0045]第一切分模块,用于根据预设尺寸对所述第一图像进行第一切分,得到至少两个第一区域;其中,每一所述第一区域的尺寸为所述预设尺寸;
[0046]第二切分模块,用于根据所述预设尺寸对所述第二图像进行第二切分,得到至少两个第二区域,其中,每一所述第二区域的尺寸为所述预设尺寸;
[0047]语义学习模块,用于将所述第一区域和所述第二区域输入至预设注意力模型进行语义学习,得到第三区域;
[0048]图像拼接模块,用于根据所述第三区域进行拼接,得到目标掩模图像;
[0049]图像分割模块,用于根据所述目标掩模图像对所述第一图像进行图像分割,得到目标信息区域;
[0050]文字识别模块,用于对所述目标信息区域进行文字识别,得到目标文字信息。
[0051]为实现上述目的,本申请实施例的第三方面提出了一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的图像信息提取方法。
[0052]为实现上述目本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像信息提取方法,其特征在于,所述方法包括:获取第一图像,并获取所述第一图像的类别,得到目标图像类别;根据所述目标图像类别获取第二图像;根据预设尺寸对所述第一图像进行第一切分,得到至少两个第一区域;其中,每一所述第一区域的尺寸为所述预设尺寸;根据所述预设尺寸对所述第二图像进行第二切分,得到至少两个第二区域,其中,每一所述第二区域的尺寸为所述预设尺寸;将所述第一区域和所述第二区域输入至预设注意力模型进行语义学习,得到第三区域;根据所述第三区域进行拼接,得到目标掩模图像;根据所述目标掩模图像对所述第一图像进行图像分割,得到目标信息区域;对所述目标信息区域进行文字识别,得到目标文字信息。2.根据权利要求1所述的图像信息提取方法,其特征在于,至少两个第一区域的数量为第一数量,至少两个第二区域的数量为第二数量;所述将所述第一区域和所述第二区域输入至预设注意力模型进行语义学习,得到第三区域,包括:将所述第一数量的所述第一区域和所述第二数量的所述第二区域输入至预设注意力模型进行语义学习,得到第三数量的候选区域,其中所述第三数量是所述第一数量与所述第二数量之和;根据预设顺序从所述第三数量的所述候选区域取出所述第一数量的所述候选区域,得到所述第一数量的所述第三区域。3.根据权利要求2所述的图像信息提取方法,其特征在于,所述预设注意力模型包括权重卷积层和第一卷积层;所述将所述第一数量的所述第一区域和所述第二数量的所述第二区域输入至预设注意力模型进行语义学习,得到第三数量的候选区域,包括:将所述第一数量的所述第一区域轮流作为第一目标区域;通过所述第一卷积层对所述第一目标区域进行第一卷积,得到第一参考向量;通过所述权重卷积层对所述第一目标区域和所述第二数量的所述第二区域进行卷积,得到所述第二数量的注意力权重;根据所述第二数量的所述注意力权重,对所述第一参考向量进行加权和,得到所述候选区域。4.根据权利要求3所述的图像信息提取方法,其特征在于,所述权重卷积层包括第二卷积层和第三卷积层;所述通过所述权重卷积层对所述第一目标区域和所述第二数量的所述第二区域进行卷积,得到所述第二数量的注意力权重,包括:通过所述第二卷积层对所述第一目标区域进行第二卷积,得到第二参考向量;通过所述第三卷积层对所述第二数量的所述第二区域进行第三卷积,得到所述第二数量的第三参考向量;将所述第二参考向量与所述第二数量的所述第三参考向量各自的乘积进行归一化处
理,得到所述第二数量的所述注意力权重。5.根据权利要求1至4任一项所述的图像信息提取方法,其特征在于,所述根据所述目标图像类别获取第二图像,包...

【专利技术属性】
技术研发人员:陈李健
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1