证件中的目标文本提取方法、装置、设备及可读存储介质制造方法及图纸

技术编号：24093093 阅读：41 留言：0更新日期：2020-05-09 08:58

本申请实施例提供了一种证件中的目标文本提取方法、装置、计算机设备及计算机可读存储介质。本申请实施例属于文本识别技术领域，通过获取同一种证件类型的模板图像和检测图像，模板图像上标注有文字锚点和目标框位置，文字锚点包括第一锚点文本；通过第一预设方式获取模板图像上的锚点位置与检测图像上的锚点位置之间的特征点匹配关系；根据特征点匹配关系，通过变换矩阵进行求解以得到透视变换算子；将检测图像通过透视变换算子进行透视变换以得到透视变换图像；通过透视变换算子获取目标框位置在透视变换图像上的投影位置；通过文本识别模型对投影位置的文本进行文本识别，以得到检测图像的目标文本，能提高文本识别的准确性和效率。

Extraction method, device, equipment and readable storage medium of target text in certificate

全部详细技术资料下载

【技术实现步骤摘要】
证件中的目标文本提取方法、装置、设备及可读存储介质
本申请涉及文本识别
，尤其涉及一种证件中的目标文本提取方法、装置、计算机设备及计算机可读存储介质。
技术介绍
近几年来，随着理论基础与硬件性能的不断发展，人工智能技术在理论和实践上都取得了不错的成果。基于神经网络的深度学习技术被应用于了各个领域，比如，用于语音识别、物体识别、物体检测、文本检测及自然语言处理等各个应用场景，都可以见到深度学习技术所带来的巨大影响和推进作用。与此同时，一些传统技术也经常作为深度学习应用中的辅助技术对应用场景进行优化和拓展，文本识别技术在深度学习技术成熟之后取得了长足进步，既可以对图像中的文本位置进行定位，同时也可以对定位到的文本进行识别。不过对于大多数用于文本识别的深度学习模型来说，其应用中也存在一些不足之处。很多用于文本识别的深度学习模型对标准正面图像的识别效果很好，但是对于一些相对于标准正面图像为处于视角旋转和变换状态的图像适应性较差，不能很好识别。然而，日常生活中取得的图片大多数都不是标准的正面图像，存在不同程度的视角变换，...

【技术保护点】
1.一种证件中的目标文本提取方法，其特征在于，所述方法包括：/n获取属于同一种证件类型的模板图像和用于提取目标文本的检测图像，所述模板图像上标注有文字锚点和目标框位置，其中，所述文字锚点为在所述模板图像上标注的固定字段，所述文字锚点包括第一锚点文本，所述第一锚点文本为所述固定字段的内容，所述目标框位置为在所述模板图像上标注的证件上需要提取的所述目标文本所在的位置；/n根据所述第一锚点文本并基于文本识别模型，通过第一预设方式获取所述第一锚点文本在所述模板图像上的锚点位置与所述第一锚点文本在所述检测图像上的锚点位置各自包含的特征点之间的特征点匹配关系，其中，锚点位置为所述第一锚点文本在对应图像上的...

【技术特征摘要】
1.一种证件中的目标文本提取方法，其特征在于，所述方法包括：
获取属于同一种证件类型的模板图像和用于提取目标文本的检测图像，所述模板图像上标注有文字锚点和目标框位置，其中，所述文字锚点为在所述模板图像上标注的固定字段，所述文字锚点包括第一锚点文本，所述第一锚点文本为所述固定字段的内容，所述目标框位置为在所述模板图像上标注的证件上需要提取的所述目标文本所在的位置；
根据所述第一锚点文本并基于文本识别模型，通过第一预设方式获取所述第一锚点文本在所述模板图像上的锚点位置与所述第一锚点文本在所述检测图像上的锚点位置各自包含的特征点之间的特征点匹配关系，其中，锚点位置为所述第一锚点文本在对应图像上的位置；
根据所述特征点匹配关系，通过变换矩阵进行求解以得到将所述检测图像进行透视变换的透视变换算子；
将所述检测图像通过所述透视变换算子进行透视变换以得到与所述模板图像视角相符的透视变换图像；
通过所述透视变换算子获取所述目标框位置在所述透视变换图像上的投影位置；
通过所述文本识别模型对所述透视变换图像上的所述投影位置的文本进行文本识别，并对识别出的文本进行提取以得到所述检测图像的目标文本。

2.根据权利要求1所述证件中的目标文本提取方法，其特征在于，所述文字锚点还包括第一锚点位置，所述根据所述第一锚点文本并基于文本识别模型，通过第一预设方式获取所述第一锚点文本在所述模板图像上的锚点位置与所述第一锚点文本在所述检测图像上的锚点位置各自包含的特征点之间的特征点匹配关系的步骤包括：
通过文本识别模型提取所述检测图像上与所述第一锚点文本一致的第二锚点文本；
基于所述文本识别模型通过所述第二锚点文本得到所述检测图像上与所述第一锚点位置相对应的第二锚点位置；
基于预设的特征点提取算法提取所述第一锚点位置包含的第一特征点集合和所述第二锚点位置包含的第二特征点集合；
根据所述第一特征点集合和所述第二特征点集合，基于特征点匹配算法获取所述第一特征点集合和所述第二特征点集合中的特征点之间的第一特征点匹配关系；
所述根据所述特征点匹配关系，通过变换矩阵进行求解以得到将所述检测图像进行透视变换的透视变换算子的步骤包括：
根据所述第一特征点匹配关系，通过变换矩阵进行求解以计算出将所述检测图像进行透视变换的第一透视变换算子；
所述将所述检测图像通过所述透视变换算子进行透视变换以得到与所述模板图像视角相符的透视变换图像的步骤包括：
将所述检测图像通过所述第一透视变换算子进行透视变换以得到与所述模板图像视角相符的第一透视变换图像。

3.根据权利要求2所述证件中的目标文本提取方法，其特征在于，所述将所述检测图像通过所述第一透视变换算子进行透视变换以得到与所述模板图像视角相符的第一透视变换图像的步骤之后，还包括：
将所述第一透视变换图像输入所述文本识别模型，通过所述第一锚点文本获取所述第一透视变换图像上与所述第一锚点位置相对应的第三锚点位置；
基于所述特征点提取算法提取所述第三锚点位置包含的第三特征点集合；
根据所述第一特征点集合和所述第三特征点集合，基于所述特征点匹配算法获取所述第一特征点集合和所述第三特征点集合中的特征点之间的第二特征点匹配关系；
根据所述第二特征点匹配关系，通过所述变换矩阵进行求解以计算出将所述第一透视变换图像进行透视变换的第二透视变换算子；
将所述第一透视变换图像通过所述第二透视变换算子进行透视变换以得到第二透视变换图像；
所述通过所述透视变换算子获取所述目标框位置在所述透视变换图像上的投影位置的步骤包括：
通过所述第二透视变换算子计算出所述目标框位置在所述第二透视变换图像上的投影位置；
所述通过所述文本识别模型对所述透视变换图像上的投影位置的文本进...

【专利技术属性】
技术研发人员：黄文韬，刘鹏，王健宗，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人