保险单识别方法、装置以及计算机设备制造方法及图纸

技术编号：25638056 阅读：13 留言：0更新日期：2020-09-15 21:30

本申请提供了一种保险单识别方法、装置以及计算机设备，涉及保险单识别技术领域，缓解了对于多种不同类型的保险单版面，保险单识别的准确度较低的技术问题。该方法包括：基于待识别保险单图像通过训练后的文本检测和识别模型得到所述待识别保险单图像中的保险单数据；将所述保险单数据中的字符与预设保险单类别关键字符进行匹配，根据匹配结果确定所述待识别保险单图像所属的保险单类型；基于所述保险单类型对应的预设标题字段匹配所述保险单识别数据，得到待识别保险单预设标题字段识别结果，匹配所有预设标题字段，最终得到整个保险单图像的识别结果。

全部详细技术资料下载

【技术实现步骤摘要】
保险单识别方法、装置以及计算机设备
本申请涉及文本识别
，尤其是涉及一种保险单识别方法、装置以及计算机设备。
技术介绍
目前，随着图像处理技术的不断发展，文字识别技术已广泛应用于对各种版面简单的证件识别，例如身份证、银行卡等。现有的文字识别技术，针对版面简单的证件识别，有较高的准确率。但是，对于复杂多变的文本版面，识别准确率往往较低。在保险领域，保险单作为保险公司和客户之间的重要关系凭证，由于其信息量大，版面复杂，市面上难有一款针对保险单高识别准确率的光学字符识别(OpticalCharacterRecognition，OCR)产品。
技术实现思路
本专利技术的目的在于提供一种保险单识别方法、装置以及计算机设备，以缓解对于多种不同类型的保险单版面，保险单识别的准确度较低的技术问题。第一方面，本申请实施例提供了一种保险单识别方法，所述方法包括：基于待识别保险单图像通过训练后的文本检测和识别模型得到所述待识别保险单图像中的保险单数据；将所述保险单数据中的字符与预设保险单类别关键字符进行匹配，根据匹配结果确定所述待识别保险单图像所属的保险单类型；基于所述保险单类型对应的预设标题字段匹配所述保险单数据，得到待识别保险单预设标题字段识别结果，匹配所有预设标题字段，最终得到整个保险单图像的识别结果。在一个可能的实现中，所述方法还包括：基于所述保险单类型对应的预设标题字段匹配保险单识别数据，如果识别数据是以表格形式存在，则需要进行表格数据分析，得到与...

【技术保护点】
1.一种保险单识别方法，其特征在于，所述方法包括：/n基于待识别保险单图像通过训练后的文本检测和识别模型得到所述待识别保险单图像中的保险单数据；/n将所述保险单数据中的字符与预设保险单类别关键字符进行匹配，根据匹配结果确定所述待识别保险单图像所属的保险单类型；/n基于所述保险单类型对应的预设标题字段匹配所述保险单数据，得到待识别保险单预设标题字段识别结果，匹配所有预设标题字段，最终得到整个保险单图像的识别结果。/n

【技术特征摘要】
1.一种保险单识别方法，其特征在于，所述方法包括：
基于待识别保险单图像通过训练后的文本检测和识别模型得到所述待识别保险单图像中的保险单数据；
将所述保险单数据中的字符与预设保险单类别关键字符进行匹配，根据匹配结果确定所述待识别保险单图像所属的保险单类型；
基于所述保险单类型对应的预设标题字段匹配所述保险单数据，得到待识别保险单预设标题字段识别结果，匹配所有预设标题字段，最终得到整个保险单图像的识别结果。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：
基于所述保险单类型对应的预设标题字段匹配保险单识别数据，如果识别数据是以表格形式存在，则需要进行表格数据分析，得到与所述预设标题字段相匹配的表格数据；
基于所述保险单类型对应的预设标题字段匹配保险单识别数据，如果识别数据是以表格形式存在，则需要进行表格数据分析，得到与所述预设标题字段相匹配的表格数据的步骤，包括：
如果与预设标题字段相匹配的数据是以表格的形式存在，则选取用于界定表格范围的基准坐标点，基于所述基准坐标点从所述保险单数据中确定位于所述表格范围内的多个表格数据；
分别对每个所述表格数据按照预设排列规则进行分割，得到多个纵列；
基于多个所述表格数据中相同主题的字段内容，将多个所述表格数据中所述纵列中的字段进行合并，得到目标表格；
将所述目标表格中的表头与字段进行对齐，得到最终表格数据；
基于所述最终表格数据，将预设标题字段与表格表头进行匹配，得到所述与预设标题字段相匹配的表格数据。

3.根据权利要求2所述的方法，其特征在于，分别对每个所述表格数据按照预设排列规则进行分割，得到多个纵列的步骤，包括：
按照预设排列规则计算所述表格数据中每一个纵列基准框图的坐标点；
针对每个所述基准框图的坐标点，从所述表格数据的框图中确定坐标点差值小于预设差值的目标框图；
将所述目标框图确定为隶属于所述基准框图的目标纵列，基于多个所述目标纵列对所述表格数据的框图进行分割，得到多个纵列。

4.根据权利要求1所述的方法，其特征在于，基于待识别保险单图像通过训练后的文本检测和识别模型得到所述待识别保险单图像中的保险单数据的步骤，包括：
通过训练后的倾斜文本检测模型对所述待识别保险单图像进行文字检测，得到所述待识别保险单图像中的文本位置；
基于所述文本位置对所述待识别保险单图像中的文本进行切分，将切分结果输入至训练后的文本识别模型，得到保险单数据；所述保险单数据包括字符位置以及与所述字符位置对应的字符内容。

5.根据权利要求1所述的方法...

【专利技术属性】
技术研发人员：李树凯，田强，位双双，姚灿，张瑞楠，赵泽通，
申请(专利权)人：阳光保险集团股份有限公司，阳光人寿保险股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人