一种图像中文字区域的编解码方法及装置制造方法及图纸

技术编号:30502018 阅读:18 留言:0更新日期:2021-10-27 22:34
本公开提供一种图像中文字区域的编解码方法及装置,涉及图像传输技术领域,能够解决现有技术中对图像中的文字有损编码,解码后文字清晰度较差的问题。具体技术方案为:首先获取目标检测图像,目标检测图像包括文字区域和图像区域;然后将目标检测图像输入识别文字区域的神经网络模型,获得特征矩阵,特征矩阵用于指示目标检测图像中的文字区域信息,包括位置信息和特征信息;最后对特征矩阵进行编码,获得附加信息域。本公开用于图像中文字区域的编码。编码。编码。

【技术实现步骤摘要】
一种图像中文字区域的编解码方法及装置


[0001]本公开涉及图像传输
,尤其涉及一种图像中文字区域的编解码方法及装置。

技术介绍

[0002]万像图像无损传输协议(Vanxum GPRS Tunnelling Protocol,简称vgtp)是现有的实时编码方案,对图像采集后,统一进行编码,编码中不关注图像本身的具体内容,从图像整体数据进行编码,各个区域平等对待,传输前对图像数据进行了有损编码,该编码经传输后到显示端解码显示时,对文字的清晰度有不小的损失,影响用户体验。

技术实现思路

[0003]本公开实施例提供一种图像中文字区域的编解码方法及装置,能够解决现有技术中对图像中的文字有损编码,解码后文字清晰度较差的问题。所述技术方案如下:
[0004]根据本公开实施例的第一方面,提供一种图像中文字区域的编码方法,该方法包括:
[0005]获取目标检测图像,所述目标检测图像包括文字区域和图像区域;
[0006]将所述目标检测图像输入识别文字区域的神经网络模型,获得特征矩阵,所述特征矩阵用于指示所述目标检测图像中的文字区域信息,包括位置信息和特征信息;
[0007]对所述特征矩阵进行编码,获得附加信息域。
[0008]本公开实施例提供的图像中文字区域的编码方法,首先获取目标检测图像,目标检测图像包括文字区域和图像区域;然后将目标检测图像输入识别文字区域的神经网络模型,获得特征矩阵,特征矩阵用于指示目标检测图像中的文字区域信息,包括位置信息和特征信息;最后对特征矩阵进行编码,获得附加信息域。本公开利用神经网络模型识别出图像中的文字区域,计算该区域像素的特征,在编码中附加该类文字区域信息,有利于后续解码后达到增强图像中文字清晰度的目的。
[0009]在一个实施例中,上述方法还包括:
[0010]对所述目标检测图像的图像区域进行编码,获得图像数据域;
[0011]将所述附加信息域与所述图像数据域发送给解码端,以使所述解码端对所述附加信息域和所述图像数据域进行解码,获得解码图像。
[0012]在一个实施例中,在所述将所述目标检测图像输入识别文字区域的神经网络模型之前,上述方法还包括:
[0013]获取目标训练集,所述目标训练集包括至少一个目标训练图像;
[0014]将所述至少一个目标训练图像中的文字部分标记为文字区域;
[0015]对所述目标训练集进行神经网络训练,获得所述识别文字区域的神经网络模型。
[0016]在一个实施例中,将所述至少一个目标训练图像中的文字部分标记为文字区域包括:
[0017]对所述至少一个目标训练图像进行角点检测,得到至少一个角点置信度大于第一预设阈值的区域;
[0018]判断所述至少一个角点置信度大于第一预设阈值的区域是否满足预设的规则形状条件;
[0019]若是,则将所述至少一个角点置信度大于第一预设阈值的区域标记为文字区域。
[0020]在一个实施例中,上述方法还包括:
[0021]若否,则对所述至少一个目标训练图像进行边缘检测,得到至少一个边缘连通区域;
[0022]判断所述至少一个角点置信度大于第一预设阈值的区域与所述至少一个边缘连通区域的重合比例是否达到第二预设阈值;
[0023]若是,则将所述至少一个角点置信度大于第一预设阈值的区域标记为文字区域;
[0024]若否,则确定所述至少一个角点置信度大于第一预设阈值的区域为非文字区域。
[0025]在一个实施例中,在所述将所述目标检测图像输入识别文字区域的神经网络模型之前,上述方法还包括:
[0026]对所述目标检测图像进行预处理,包括灰度化、降噪、二值化、字符切分、归一化中的至少一种。
[0027]根据本公开实施例的第二方面,提供一种图像中文字区域的解码方法,该方法包括:
[0028]接收编码端发送的图像数据域和附加信息域;
[0029]对所述图像数据域进行解码获得图像数据;
[0030]对所述附加信息域进行解码获得特征矩阵,所述特征矩阵用于指示目标检测图像中的文字区域信息,包括位置信息和特征信息;
[0031]根据所述特征矩阵重建所述图像数据中的文字区域,获得目标解码图像。
[0032]本公开实施例提供的图像中文字区域的解码方法,首先接收编码端发送的图像数据域和附加信息域;然后对图像数据域进行解码获得图像数据;对附加信息域进行解码获得特征矩阵,特征矩阵用于指示目标检测图像中的文字区域信息,包括位置信息和特征信息;最后根据特征矩阵重建图像数据中的文字区域,获得目标解码图像。本公开附加图像中文字区域的信息,在图像显示时,结合附加信息对文字区域重建,达到增强图像中文字清晰度的目的。
[0033]根据本公开实施例的第三方面,提供一种图像中文字区域的编码装置,包括获取模块、输出模块和编码模块;
[0034]所述获取模块,用于获取目标检测图像,所述目标检测图像包括文字区域和图像区域;
[0035]所述输出模块,用于将所述目标检测图像输入识别文字区域的神经网络模型,获得特征矩阵,所述特征矩阵用于指示所述目标检测图像中的文字区域信息,包括位置信息和特征信息;
[0036]所述编码模块,用于对所述特征矩阵进行编码,获得附加信息域。
[0037]本公开实施例提供的图像中文字区域的编码装置,包括获取模块、输出模块和编码模块;获取模块,用于获取目标检测图像,目标检测图像包括文字区域和图像区域;输出
模块,用于将目标检测图像输入识别文字区域的神经网络模型,获得特征矩阵,特征矩阵用于指示目标检测图像中的文字区域信息,包括位置信息和特征信息;编码模块,用于对特征矩阵进行编码,获得附加信息域。本公开利用神经网络模型识别出图像中的文字区域,计算该区域像素的特征,在编码中附加该类文字区域信息,有利于后续解码后达到增强图像中文字清晰度的目的。
[0038]在一个实施例中,编码模块还用于对所述目标检测图像的图像区域进行编码,获得图像数据域;
[0039]所述装置还包括发送模块,用于将所述附加信息域与所述图像数据域发送给解码端,以使所述解码端对所述附加信息域和所述图像数据域进行解码,获得解码图像。
[0040]根据本公开实施例的第四方面,提供一种图像中文字区域的解码装置,包括接收模块、解码模块和重建模块;
[0041]所述接收模块,用于接收编码端发送的图像数据域和附加信息域;
[0042]所述解码模块,用于对所述图像数据域进行解码获得图像数据;对所述附加信息域进行解码获得特征矩阵,所述特征矩阵用于指示目标检测图像中的文字区域信息,包括位置信息和特征信息;
[0043]所述重建模块,还用于根据所述特征矩阵重建所述图像数据中的文字区域,获得目标解码图像。
[0044]本公开实施例提供的图像中文字区域的解码装置,包括接收模块、解码模块和重建模块;接收模块,用于接收编码端本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像中文字区域的编码方法,其特征在于,所述方法包括:获取目标检测图像,所述目标检测图像包括文字区域和图像区域;将所述目标检测图像输入识别文字区域的神经网络模型,获得特征矩阵,所述特征矩阵用于指示所述目标检测图像中的文字区域信息,包括位置信息和特征信息;对所述特征矩阵进行编码,获得附加信息域。2.根据权利要求1所述的图像中文字区域的编码方法,其特征在于,所述方法还包括:对所述目标检测图像的图像区域进行编码,获得图像数据域;将所述附加信息域与所述图像数据域发送给解码端,以使所述解码端对所述附加信息域和所述图像数据域进行解码,获得解码图像。3.根据权利要求1所述的图像中文字区域的编码方法,其特征在于,在所述将所述目标检测图像输入识别文字区域的神经网络模型之前,所述方法还包括:获取目标训练集,所述目标训练集包括至少一个目标训练图像;将所述至少一个目标训练图像中的文字部分标记为文字区域;对所述目标训练集进行神经网络训练,获得所述识别文字区域的神经网络模型。4.根据权利要求1所述的图像中文字区域的编码方法,其特征在于,所述将所述至少一个目标训练图像中的文字部分标记为文字区域包括:对所述至少一个目标训练图像进行角点检测,得到至少一个角点置信度大于第一预设阈值的区域;判断所述至少一个角点置信度大于第一预设阈值的区域是否满足预设的规则形状条件;若是,则将所述至少一个角点置信度大于第一预设阈值的区域标记为文字区域。5.根据权利要求4所述的图像中文字区域的编码方法,其特征在于,所述方法还包括:若否,则对所述至少一个目标训练图像进行边缘检测,得到至少一个边缘连通区域;判断所述至少一个角点置信度大于第一预设阈值的区域与所述至少一个边缘连通区域的重合比例是否达到第二预设阈值;若是,则将所述至少一个角点置信度大于第一预设阈值的区域标记为文字区域;若否,则确定所述至少一个角点置信度大于第一预设阈值的区域为非文字...

【专利技术属性】
技术研发人员:李昊
申请(专利权)人:西安万像电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1