一种图像中文字区域的编解码方法及装置制造方法及图纸

技术编号：30502018 阅读：18 留言：0更新日期：2021-10-27 22:34

本公开提供一种图像中文字区域的编解码方法及装置，涉及图像传输技术领域，能够解决现有技术中对图像中的文字有损编码，解码后文字清晰度较差的问题。具体技术方案为：首先获取目标检测图像，目标检测图像包括文字区域和图像区域；然后将目标检测图像输入识别文字区域的神经网络模型，获得特征矩阵，特征矩阵用于指示目标检测图像中的文字区域信息，包括位置信息和特征信息；最后对特征矩阵进行编码，获得附加信息域。本公开用于图像中文字区域的编码。编码。编码。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像中文字区域的编解码方法及装置

[0001]本公开涉及图像传输
，尤其涉及一种图像中文字区域的编解码方法及装置。

技术介绍

[0002]万像图像无损传输协议(Vanxum GPRS Tunnelling Protocol，简称vgtp)是现有的实时编码方案，对图像采集后，统一进行编码，编码中不关注图像本身的具体内容，从图像整体数据进行编码，各个区域平等对待，传输前对图像数据进行了有损编码，该编码经传输后到显示端解码显示时，对文字的清晰度有不小的损失，影响用户体验。

技术实现思路

[0003]本公开实施例提供一种图像中文字区域的编解码方法及装置，能够解决现有技术中对图像中的文字有损编码，解码后文字清晰度较差的问题。所述技术方案如下：
[0004]根据本公开实施例的第一方面，提供一种图像中文字区域的编码方法，该方法包括：
[0005]获取目标检测图像，所述目标检测图像包括文字区域和图像区域；
[0006]将所述目标检测图像输入识别文字区域的神经网络模型，获得特征矩阵，所述特征矩阵用于指示所述目标检测图像中的文字区域信息，包括位置信息和特征信息；
[0007]对所述特征矩阵进行编码，获得附加信息域。
[0008]本公开实施例提供的图像中文字区域的编码方法，首先获取目标检测图像，目标检测图像包括文字区域和图像区域；然后将目标检测图像输入识别文字区域的神经网络模型，获得特征矩阵，特征矩阵用于指示目标检测图像中的文字区域信息，包括位置信息和特征信息；最后对特征矩...

【技术保护点】

【技术特征摘要】
1.一种图像中文字区域的编码方法，其特征在于，所述方法包括：获取目标检测图像，所述目标检测图像包括文字区域和图像区域；将所述目标检测图像输入识别文字区域的神经网络模型，获得特征矩阵，所述特征矩阵用于指示所述目标检测图像中的文字区域信息，包括位置信息和特征信息；对所述特征矩阵进行编码，获得附加信息域。2.根据权利要求1所述的图像中文字区域的编码方法，其特征在于，所述方法还包括：对所述目标检测图像的图像区域进行编码，获得图像数据域；将所述附加信息域与所述图像数据域发送给解码端，以使所述解码端对所述附加信息域和所述图像数据域进行解码，获得解码图像。3.根据权利要求1所述的图像中文字区域的编码方法，其特征在于，在所述将所述目标检测图像输入识别文字区域的神经网络模型之前，所述方法还包括：获取目标训练集，所述目标训练集包括至少一个目标训练图像；将所述至少一个目标训练图像中的文字部分标记为文字区域；对所述目标训练集进行神经网络训练，获得所述识别文字区域的神经网络模型。4.根据权利要求1所述的图像中文字区域的编码方法，其特征在于，所述将所述至少一个目标训练图像中的文字部分标记为文字区域包括：对所述至少一个目标训练图像进行角点检测，得到至少一个角点置信度大于第一预设阈值的区域；判断所述至少一个角点置信度大于第一预设阈值的区域是否满足预设的规则形状条件；若是，则将所述至少一个角点置信度大于第一预设阈值的区域标记为文字区域。5.根据权利要求4所述的图像中文字区域的编码方法，其特征在于，所述方法还包括：若否，则对所述至少一个目标训练图像进行边缘检测，得到至少一个边缘连通区域；判断所述至少一个角点置信度大于第一预设阈值的区域与所述至少一个边缘连通区域的重合比例是否达到第二预设阈值；若是，则将所述至少一个角点置信度大于第一预设阈值的区域标记为文字区域；若否，则确定所述至少一个角点置信度大于第一预设阈值的区域为非文字...

【专利技术属性】
技术研发人员：李昊，
申请(专利权)人：西安万像电子科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人