一种文本识别方法、装置、终端及计算机可读存储介质制造方法及图纸

技术编号:37814053 阅读:5 留言:0更新日期:2023-06-09 09:44
本发明专利技术提供一种文本识别方法、装置、终端及计算机可读存储介质,文本识别方法通过对当前视频帧中目标对象上的待识别文本进行识别,得到待识别文本对应的初始识别结果;将当前视频帧中的目标对象与当前视频帧之前的历史视频帧中的目标进行比对,确定目标对象的标识信息;响应于标识信息与预设身份相同,则将标识信息对应的字符数组和各字符的置信度存储到预设身份对应的缓存序列,确定字符位置对应的更新字符序列;基于预设身份对应的各字符位置的更新字符序列中各字符以及对应的置信度确定各字符位置的识别结果,得到待识别文本的识别结果。本申请基于当前视频帧以及历史视频帧中的初始识别结果共同确定识别结果,提高了文本识别的准确性。本识别的准确性。本识别的准确性。

【技术实现步骤摘要】
一种文本识别方法、装置、终端及计算机可读存储介质


[0001]本专利技术涉及文本识别
,特别是涉及一种文本识别方法、装置、终端及计算机可读存储介质。

技术介绍

[0002]随着计算机算力的不断提升,深度学习在图像检测领域和陆路交通中被广泛应用。与此同时,已经有一些基于深度学习的方法被用于船名识别。这些方法先基于文本检测阶段检测文本区域,再通过文本识别阶段识别区域内的字符。在实际应用中,当船只在运动过程中,因视角、光照、船身部分超出视野、字符短暂遮挡等原因船只标识受到干扰时,船名识别效果会有所降低。

技术实现思路

[0003]本专利技术主要解决的技术问题是提供一种文本识别方法、装置、终端及计算机可读存储介质,解决现有技术中文本识别准确率比较低的问题。
[0004]为解决上述技术问题,本专利技术采用的第一个技术方案是:提供一种文本识别方法,文本识别方法包括:
[0005]对当前视频帧中目标对象上的待识别文本进行识别,得到待识别文本对应的初始识别结果;初始识别结果包括至少一个字符组成的字符数组以及各字符的置信度;
[0006]将当前视频帧中的目标对象与当前视频帧之前的历史视频帧中的目标进行比对,确定目标对象的标识信息;
[0007]响应于标识信息与预设数据库中的预设身份相同,则将标识信息对应的字符数组和各字符的置信度存储到预设身份对应的缓存序列,确定缓存序列中各字符位置对应的更新字符序列;预设数据库包括历史视频帧中包含的目标对应的初始识别结果;
[0008]基于预设身份对应的各字符位置的更新字符序列中各字符以及对应的置信度确定各字符位置的识别结果,得到待识别文本的识别结果。
[0009]其中,文本识别方法还包括:
[0010]将目标对象的标识信息与预设数据库中的各预设身份进行比对;
[0011]响应于目标对象的标识信息与各预设身份均不相同,则将目标对象的标识信息以及目标对象对应的初始识别结果存入预设数据库;
[0012]将目标对象对应的初始识别结果作为待识别文本的识别结果。
[0013]其中,将标识信息对应的字符数组和各字符的置信度存储到预设身份对应的缓存序列,确定缓存序列中各字符位置对应的更新字符序列,包括:
[0014]判断各字符位置的字符序列中字符的数量是否达到预设数量;
[0015]如果字符位置的字符序列中字符的数量达到预设数量,则用目标对象对应的字符数组中对应字符位置的字符替换字符序列中最低置信度对应的字符得到字符位置对应的更新字符序列;
[0016]如果字符位置的字符序列中字符的数量未达到预设数量,则将目标对象对应的字符数组中对应字符位置的字符添加到字符位置的字符序列中得到字符位置对应的更新字符序列。
[0017]其中,基于预设身份对应的各字符位置的更新字符序列中各字符以及对应的置信度确定各字符位置的识别结果,得到待识别文本的识别结果,包括:
[0018]基于字符位置的更新字符序列中的各字符,确定字符位置对应类别字符;
[0019]基于类别字符对应的所有置信度,确定类别字符的类别置信度;
[0020]选取数值最大的的类别置信度对应的类别字符作为字符位置的识别结果;
[0021]将各字符位置的识别结果根据位置进行排列,得到待识别文本的识别结果。
[0022]其中,对当前视频帧中目标对象上的待识别文本进行识别,得到待识别文本对应的初始识别结果,包括:
[0023]对当前视频帧进行目标检测并提取,得到包含目标对象的第一区域图像;
[0024]对第一区域图像进行文本检测并提取,得到包含待识别文本的第二区域图像;第二区域图像为第一区域图像的子图像;
[0025]对第二区域图像进行文本识别,得到待识别文本的初始识别结果。
[0026]其中,将当前视频帧中的目标对象与当前视频帧之前的历史视频帧中的目标进行比对,确定目标对象的标识信息,包括:
[0027]计算第一区域图像中的目标对象与当前视频帧之前相邻的预设数量的历史视频帧中的各目标之间的相似度;
[0028]响应于目标对象与目标之间的相似度超过相似度阈值,则将目标关联的预设身份作为目标对象的标识信息;
[0029]响应于目标对象与各目标之间的相似度均未超过相似度阈值,则为目标对象分配标识信息。
[0030]其中,文本识别方法还包括:
[0031]响应于预设数据库中预设身份对应的各位置的字符序列连续预设数量帧均未进行更新,则将预设身份和预设身份对应的各位置的字符序列进行删除。
[0032]为解决上述技术问题,本专利技术采用的第二个技术方案是:提供一种文本识别装置,文本识别装置包括:
[0033]识别模块,用于对当前视频帧中目标对象上的待识别文本进行识别,得到待识别文本对应的初始识别结果;初始识别结果包括至少一个字符组成的字符数组以及各字符的置信度;
[0034]跟踪模块,用于将当前视频帧中的目标对象与当前视频帧之前的历史视频帧中的目标进行比对,确定目标对象的标识信息;
[0035]更新模块,用于响应于标识信息与预设数据库中的预设身份相同,则将标识信息对应的字符数组和各字符的置信度存储到预设身份对应的缓存序列,确定缓存序列中各字符位置对应的更新字符序列;预设数据库包括历史视频帧中包含的目标对应的初始识别结果;
[0036]分析模块,用于基于预设身份对应的各字符位置的更新字符序列中各字符以及对应的置信度确定各字符位置的识别结果,得到待识别文本的识别结果。
[0037]为解决上述技术问题,本专利技术采用的第三个技术方案是:提供一种终端,该终端包括存储器、处理器以及存储于存储器中并在处理器上运行的计算机程序,处理器用于执行程序数据以实现上述文本识别方法中的步骤。
[0038]为解决上述技术问题,本专利技术采用的第四个技术方案是:提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述文本识别方法中的步骤。
[0039]本专利技术的有益效果是:区别于现有技术的情况,提供的一种文本识别方法、装置、终端及计算机可读存储介质,文本识别方法通过对当前视频帧中目标对象上的待识别文本进行识别,得到待识别文本对应的初始识别结果;初始识别结果包括至少一个字符组成的字符数组以及各字符的置信度;将当前视频帧中的目标对象与当前视频帧之前的历史视频帧中的目标进行比对,确定目标对象的标识信息;响应于标识信息与预设数据库中的预设身份相同,则将标识信息对应的字符数组和各字符的置信度存储到预设身份对应的缓存序列,确定缓存序列中各字符位置对应的更新字符序列;预设数据库包括历史视频帧中包含的目标对应的初始识别结果;基于预设身份对应的各字符位置的更新字符序列中各字符以及对应的置信度确定各字符位置的识别结果,得到待识别文本的识别结果。本申请中基于当前视频帧中目标对象的标识信息在预设数据库中查找与标识信息一致的预设身份,基于当前视频帧中的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法,其特征在于,所述文本识别方法包括:对所述当前视频帧中目标对象上的待识别文本进行识别,得到所述待识别文本对应的初始识别结果;所述初始识别结果包括至少一个字符组成的字符数组以及各所述字符的置信度;将所述当前视频帧中的所述目标对象与所述当前视频帧之前的历史视频帧中的目标进行比对,确定所述目标对象的标识信息;响应于所述标识信息与预设数据库中的预设身份相同,则将所述标识信息对应的所述字符数组和各所述字符的置信度存储到所述预设身份对应的缓存序列,确定所述缓存序列中各字符位置对应的更新字符序列;所述预设数据库包括所述历史视频帧中包含的所述目标对应的所述初始识别结果;基于所述预设身份对应的各所述字符位置的更新字符序列中各所述字符以及对应的所述置信度确定各所述字符位置的识别结果,得到所述待识别文本的识别结果。2.根据权利要求1所述的文本识别方法,其特征在于,所述文本识别方法还包括:将所述目标对象的标识信息与所述预设数据库中的各所述预设身份进行比对;响应于所述目标对象的标识信息与各所述预设身份均不相同,则将所述目标对象的标识信息以及所述目标对象对应的所述初始识别结果存入所述预设数据库;将所述目标对象对应的所述初始识别结果作为所述待识别文本的识别结果。3.根据权利要求1所述的文本识别方法,其特征在于,所述将所述标识信息对应的所述字符数组和各所述字符的置信度存储到所述预设身份对应的缓存序列,确定所述缓存序列中各字符位置对应的更新字符序列,包括:判断各所述字符位置的字符序列中所述字符的数量是否达到预设数量;如果所述字符位置的字符序列中所述字符的数量达到所述预设数量,则用所述目标对象对应的所述字符数组中对应所述字符位置的所述字符替换所述字符序列中最低所述置信度对应的所述字符得到所述字符位置对应的更新字符序列;如果所述字符位置的字符序列中所述字符的数量未达到所述预设数量,则将所述目标对象对应的所述字符数组中对应所述字符位置的所述字符添加到所述字符位置的字符序列中得到所述字符位置对应的更新字符序列。4.根据权利要求1所述的文本识别方法,其特征在于,所述基于所述预设身份对应的各所述字符位置的更新字符序列中各所述字符以及对应的所述置信度确定各所述字符位置的识别结果,得到所述待识别文本的识别结果,包括:基于所述字符位置的更新字符序列中的各所述字符,确定所述字符位置对应类别字符;基于所述类别字符对应的所有所述置信度,确定所述类别字符的类别置信度;选取数值最大的的所述类别置信度对应的所述类别字符作为所述字符位置的识别结果;将各所述字符位置的识别结果根据位置进行排列,得到所述待识别文本的识别结果。5.根据权利要求1所述的文本识别方法,其特征在...

【专利技术属性】
技术研发人员:陈亚松吴棫李越杨坤兴吴昌金
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1