一种文本识别方法、装置、终端及计算机可读存储介质制造方法及图纸

技术编号：37814053 阅读：5 留言：0更新日期：2023-06-09 09:44

本发明专利技术提供一种文本识别方法、装置、终端及计算机可读存储介质，文本识别方法通过对当前视频帧中目标对象上的待识别文本进行识别，得到待识别文本对应的初始识别结果；将当前视频帧中的目标对象与当前视频帧之前的历史视频帧中的目标进行比对，确定目标对象的标识信息；响应于标识信息与预设身份相同，则将标识信息对应的字符数组和各字符的置信度存储到预设身份对应的缓存序列，确定字符位置对应的更新字符序列；基于预设身份对应的各字符位置的更新字符序列中各字符以及对应的置信度确定各字符位置的识别结果，得到待识别文本的识别结果。本申请基于当前视频帧以及历史视频帧中的初始识别结果共同确定识别结果，提高了文本识别的准确性。本识别的准确性。本识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本识别方法、装置、终端及计算机可读存储介质

[0001]本专利技术涉及文本识别
，特别是涉及一种文本识别方法、装置、终端及计算机可读存储介质。

技术介绍

[0002]随着计算机算力的不断提升，深度学习在图像检测领域和陆路交通中被广泛应用。与此同时，已经有一些基于深度学习的方法被用于船名识别。这些方法先基于文本检测阶段检测文本区域，再通过文本识别阶段识别区域内的字符。在实际应用中，当船只在运动过程中，因视角、光照、船身部分超出视野、字符短暂遮挡等原因船只标识受到干扰时，船名识别效果会有所降低。

技术实现思路

[0003]本专利技术主要解决的技术问题是提供一种文本识别方法、装置、终端及计算机可读存储介质，解决现有技术中文本识别准确率比较低的问题。
[0004]为解决上述技术问题，本专利技术采用的第一个技术方案是：提供一种文本识别方法，文本识别方法包括：
[0005]对当前视频帧中目标对象上的待识别文本进行识别，得到待识别文本对应的初始识别结果；初始识别结果包括至少一个字符组成的字符数组以及各字符的置信度；
[0006]将当前视频帧中的目标对象与当前视频帧之前的历史视频帧中的目标进行比对，确定目标对象的标识信息；
[0007]响应于标识信息与预设数据库中的预设身份相同，则将标识信息对应的字符数组和各字符的置信度存储到预设身份对应的缓存序列，确定缓存序列中各字符位置对应的更新字符序列；预设数据库包括历史视频帧中包含的目标对应的初始识别结果；
[0008]基于...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法，其特征在于，所述文本识别方法包括：对所述当前视频帧中目标对象上的待识别文本进行识别，得到所述待识别文本对应的初始识别结果；所述初始识别结果包括至少一个字符组成的字符数组以及各所述字符的置信度；将所述当前视频帧中的所述目标对象与所述当前视频帧之前的历史视频帧中的目标进行比对，确定所述目标对象的标识信息；响应于所述标识信息与预设数据库中的预设身份相同，则将所述标识信息对应的所述字符数组和各所述字符的置信度存储到所述预设身份对应的缓存序列，确定所述缓存序列中各字符位置对应的更新字符序列；所述预设数据库包括所述历史视频帧中包含的所述目标对应的所述初始识别结果；基于所述预设身份对应的各所述字符位置的更新字符序列中各所述字符以及对应的所述置信度确定各所述字符位置的识别结果，得到所述待识别文本的识别结果。2.根据权利要求1所述的文本识别方法，其特征在于，所述文本识别方法还包括：将所述目标对象的标识信息与所述预设数据库中的各所述预设身份进行比对；响应于所述目标对象的标识信息与各所述预设身份均不相同，则将所述目标对象的标识信息以及所述目标对象对应的所述初始识别结果存入所述预设数据库；将所述目标对象对应的所述初始识别结果作为所述待识别文本的识别结果。3.根据权利要求1所述的文本识别方法，其特征在于，所述将所述标识信息对应的所述字符数组和各所述字符的置信度存储到所述预设身份对应的缓存序列，确定所述缓存序列中各字符位置对应的更新字符序列，包括：判断各所述字符位置的字符序列中所述字符的数量是否达到预设数量；如果所述字符位置的字符序列中所述字符的数量达到所述预设数量，则用所述目标对象对应的所述字符数组中对应所述字符位置的所述字符替换所述字符序列中最低所述置信度对应的所述字符得到所述字符位置对应的更新字符序列；如果所述字符位置的字符序列中所述字符的数量未达到所述预设数量，则将所述目标对象对应的所述字符数组中对应所述字符位置的所述字符添加到所述字符位置的字符序列中得到所述字符位置对应的更新字符序列。4.根据权利要求1所述的文本识别方法，其特征在于，所述基于所述预设身份对应的各所述字符位置的更新字符序列中各所述字符以及对应的所述置信度确定各所述字符位置的识别结果，得到所述待识别文本的识别结果，包括：基于所述字符位置的更新字符序列中的各所述字符，确定所述字符位置对应类别字符；基于所述类别字符对应的所有所述置信度，确定所述类别字符的类别置信度；选取数值最大的的所述类别置信度对应的所述类别字符作为所述字符位置的识别结果；将各所述字符位置的识别结果根据位置进行排列，得到所述待识别文本的识别结果。5.根据权利要求1所述的文本识别方法，其特征在...

【专利技术属性】
技术研发人员：陈亚松，吴棫，李越，杨坤兴，吴昌金，
申请(专利权)人：浙江大华技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人