文本的识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号：32541230 阅读：32 留言：0更新日期：2022-03-05 11:38

本发明专利技术实施例提供了一种文本的识别方法和装置，其中，所述方法包括：视频帧图像中提取出包含至少一个文本框的文本图像，识别出文本图像的特征向量；根据特征向量和文本排列规则对各文本框内的文本内容进行分类得到对应的语种信息；针对各文本框内的文本内容分别选择与各语种信息对应的文本识别算法，并根据选择的文本识别算法对相应的文本框中的文本内容进行识别，文本内容对应的语种信息。本发明专利技术实施例解决现有的利用一种文本识别算法对包含多语种的文本内容进行识别，导致的文本识别遗漏、文本识别错误等识别不准确的技术问题，达到提升文本识别准确率的效果。到提升文本识别准确率的效果。到提升文本识别准确率的效果。

全部详细技术资料下载

【技术实现步骤摘要】
文本的识别方法、装置、电子设备和存储介质

[0001]本专利技术涉及计算机
，特别是涉及一种文本的识别方法和装置，以及一种电子设备和一种计算机可读存储介质。

技术介绍

[0002]目前，识别图像中的文本，需要通过两个步骤实现。先通过检测器检测图像中的文本位置，然后通过文本识别算法对具体的文本进行识别。
[0003]当使用一个文本识别算法对包括了不同语种的文本进行识别时，由于文本识别算法通常仅用于识别唯一语种的文本，会造成部分语种的文本中的部分语种被遗漏或者识别错误的问题，导致识别得到的结果不准确。

技术实现思路

[0004]本专利技术实施例的目的在于提供一种文本的识别方法和装置，以及一种电子设备和一种计算机可读存储介质，解决了文本识别不准确的问题。具体技术方案如下：
[0005]在本专利技术实施例的第一方面，首先提供了一种文本的识别方法，包括：获取待处理的视频帧图像；从所述视频帧图像中提取出文本图像，并识别出所述文本图像的特征向量，所述文本图像中包含至少一个文本框；根据所述特征向量和预设...

【技术保护点】

【技术特征摘要】
1.一种文本的识别方法，其特征在于，包括：获取待处理的视频帧图像；从所述视频帧图像中提取出文本图像，并识别出所述文本图像的特征向量，所述文本图像中包含至少一个文本框；根据所述特征向量和预设的文本排列规则，对各所述文本框内的文本内容进行分类得到对应的语种信息，所述文本排列规则表示对应于各所述语种信息的文本内容在展示时所占用的字符信息；针对各所述文本框内的文本内容，分别选择与各所述语种信息对应的文本识别算法，并根据选择的所述文本识别算法对相应的所述文本框中的文本内容进行识别，所述文本内容对应的语种信息，与选择的所述文本识别算法对应的语种信息相同。2.根据权利要求1所述的方法，其特征在于，所述根据所述特征向量和预设的文本排列规则，对各所述文本框内的文本内容进行分类得到对应的语种信息，包括：根据所述特征向量和所述文本排列规则，对各所述文本框内的文本内容所包含的各字符进行分类得到分类结果；将每个所述文本框对应的分类结果映射为每个所述文本框各自对应的所述语种信息。3.根据权利要求2所述的方法，其特征在于，所述根据所述特征向量和所述文本排列规则，对各所述文本框内的文本内容所包含的各字符进行分类得到分类结果，包括：将所述文本图像输入卷积神经网络，得到所述文本图像的各像素点的图像特征向量，将所述图像特征向量输入循环神经网络，得到所述像素点的文本特征向量；根据所述文本特征向量统计各所述字符占用的关联像素点或独立像素点的数量，所述关联像素点为一组相邻的像素点，且该一组相邻的像素点具有关联的所述文本特征向量，所述独立像素点为与自身相邻的像素点不具有关联的所述文本特征向量的像素点；根据所述数量和所述文本排列规则对各所述字符进行分类得到所述分类结果。4.根据权利要求3所述的方法，其特征在于，所述文本排列规则包含所述数量所在的数量范围与所述分类结果之间的对应关系；所述根据所述数量和所述文本排列规则对各所述字符进行分类得到所述分类结果，包括：针对各所述字符，将与所述数量所在的数量范围具有所述对应关系的所述分类结果，作为各所述字符的分类结果。5.根据权利要求2所述的方法，其特征在于，所述将每个所述文本框对应的分类结果映射为每个所述文本框各自对应的所述语种信息，包括：针对每个所述文本框，若同一个所述文本框...

【专利技术属性】
技术研发人员：赵瑞书，
申请(专利权)人：北京奇艺世纪科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人