汉字识别方法、装置、计算机可读介质及电子设备制造方法及图纸

技术编号：23050929 阅读：112 留言：0更新日期：2020-01-07 14:54

本公开涉及一种汉字识别方法、装置、计算机可读介质及电子设备。方法包括：接收客户端发送的待识别图像；确定待识别图像中待识别文字行的特征向量组，特征向量组中各特征向量的维度为汉字信息库中所有汉字所包含的部件数和部件间结构关系数之和；将特征向量组中的非零元素转化为0或1，得到新的特征向量组；根据新的特征向量组，获取待识别汉字行中包括的至少一个汉字，并将其发送至客户端。由此，各特征向量的维度相对较低。这样，可以减少确定特征向量组时的计算工作量，并且，根据新的特征向量组获取待识别汉字行中包括的至少一个汉字的时长也大大缩短，从而提高了汉字识别的效率。此外，还可以达到节省存储空间的目的。

Chinese character recognition method, device, computer readable medium and electronic equipment

全部详细技术资料下载

【技术实现步骤摘要】
汉字识别方法、装置、计算机可读介质及电子设备
本公开涉及图像文字识别领域，具体地，涉及一种汉字识别方法、装置、计算机可读介质及电子设备。
技术介绍
现阶段，汉字的编码大多采用独热码(one-hotcode)方式，这样，汉字信息库中有7445个汉字和图形字符，则用于表示每个汉字和图形字符的编码的维度就有七千多个，是非常庞大且臃肿的编码方式。采用该种编码方式进行汉字识别时，由于编码维度较高，汉字识别过程较为费时，且需要占用较大的存储空间。
技术实现思路
提供该
技术实现思路
部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。第一方面，本公开提供一种汉字识别方法，包括：接收客户端发送的待识别图像；确定所述待识别图像中待识别文字行的特征向量组，其中，所述特征向量组中各特征向量的维度为汉字信息库中所有汉字所包含的部件数和部件间结构关系数之和，所述特征向量中的各元素为所述所有汉字所包含的部件或部件间结构关系对应的概率值，所述部件包括偏旁和部首；根据预设规则，将所述特征向量组中的非零元素转化为0或1，得到新的特征向量组；根据所述新的特征向量组，获取所述待识别汉字行中包括的至少一个汉字。第二方面，本公开提供一种汉字识别装置，包括：接收模块，用于接收客户端发送的待识别图像；第一确定模块，用于确定所述接收模块接收到的所述待识别图像中待识别文字行的特征向量组，其中，所...

【技术保护点】
1.一种汉字识别方法，其特征在于，包括：/n接收客户端发送的待识别图像；/n确定所述待识别图像中待识别文字行的特征向量组，其中，所述特征向量组中各特征向量的维度为汉字信息库中所有汉字所包含的部件数和部件间结构关系数之和，所述特征向量中的各元素为所述所有汉字所包含的部件或部件间结构关系对应的概率值，所述部件包括偏旁和部首；/n根据预设规则，将所述特征向量组中的非零元素转化为0或1，得到新的特征向量组；/n根据所述新的特征向量组，获取所述待识别汉字行中包括的至少一个汉字。/n

【技术特征摘要】
1.一种汉字识别方法，其特征在于，包括：
接收客户端发送的待识别图像；
确定所述待识别图像中待识别文字行的特征向量组，其中，所述特征向量组中各特征向量的维度为汉字信息库中所有汉字所包含的部件数和部件间结构关系数之和，所述特征向量中的各元素为所述所有汉字所包含的部件或部件间结构关系对应的概率值，所述部件包括偏旁和部首；
根据预设规则，将所述特征向量组中的非零元素转化为0或1，得到新的特征向量组；
根据所述新的特征向量组，获取所述待识别汉字行中包括的至少一个汉字。

2.根据权利要求1所述的方法，其特征在于，所述根据预设规则，将所述特征向量组中的非零元素转换为0或1，包括：
针对所述特征向量组中的每个非零元素，若所述非零元素大于预设阈值，则将所述非零元素置1；
若所述非零元素小于或等于所述预设阈值，则将所述非零元素置0。

3.根据权利要求1所述的方法，其特征在于，所述根据所述新的特征向量组，获取所述待识别汉字行中包括的至少一个汉字，包括：
针对所述新的特征向量组中的每个新的特征向量，从所述汉字信息库中各汉字对应的编码中，确定出与所述新的特征向量相匹配的目标编码；
将所述目标编码对应的汉字确定为目标汉字，得到所述待识别汉字行中包括的至少一个汉字。

4.根据权利要求1所述的方法，其特征在于，所述确定所述待识别图像中待识别文字行的特征向量组，包括：
将所述待识别图像中待识别文字行输入到预设神经网络模型中，得到所述待识别文字行的特征向量组，其中，所述预设神经网络模型根据所述汉字信息库中各汉字对应的编码构建。

5.根据权利要求4所述的方法，其特征在于，所述预设神经网络模型根据汉字信息库中各汉字对应的编码，通过以下步骤来构建：
获取多个训练样本图像；
将所述多个训练样本图像中文字行输入到初始神经网络模型中，得到所述初始神经网络模型的输出结果，其中，所述初始神经网络模型中具有至少一层卷积层、且至少一层卷积层的卷积核数量根据所述编码的长度确定，所述至少一层包括最后一层，所述卷积层用于根据卷积核的大小和步长扫描所述训练样本图像，以对所述训练样本图像中文字行进行特征提取和特征映射，所述长度等于所述维度；
根据所述输出结果和标记数据的比对结果，对所述初始神经网络模型进行训练，得到预设神经网络模型，其中，所述标记数据为与所述多个训练样本图像中文字行分别对应的识别正确的特征向量组。

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：
将所述至少一个汉字发送至所述客户端，以由所述客户端进行展现。

7.根据权利要求1-6中任一项所述的方法，其特征在于，所述汉字信息库中各汉字对应的编码通过以下方式来确定：
针对所述汉字信息库中的每个汉字，获取所述汉字所包含的部件和部件间结构关系；
针对每个所述部件，将第一编码序列中、与所述部件对应的元素值修改为第一比特值，得到第二编码序列，其中，所述第一编码序列为各元素值均为第二比特值的二进制比特序列，且部件结构集中的各部件或部件间结构关系分别与所述第一编码序列中的各元素一一对应，所述部件结构集为所述汉字信息库中所有汉字所包含的部件和部件间结构关系构成的集合；
针对每个所述部件间结构关系，将所述第二编码序列中、与所述部件间结构关系对应的元素值修改为所述第一比特值，得到所述汉字对应的编码。

8.根据权利要求1-6中任一项所述的方法，其特征在于，所述汉字信息库中各汉字对应的编码通过以下方式来确定：
针对所述汉字信息库中的每个汉字，获取所述汉字所包含的部件和部件间结构关系；
针对每个所述部件，将第三编码序列中、与所述部件对应的元素值修改为第一比特值，得到第四编码序列，其中，所述第三编码序列为各元素值均为第二比特值的二进制比特序列，且部件集中的各部件分别与所述第三编码序列中的各元素一一对应，所述部件集为所述汉字信息库中所有汉字所包含的部件构成的集合；
针对每个所述部件间结构关系，将第五编码序列中、与所述部件间结构关系对应的元素值修改为所述第一比特值，得到第六编码序列，其中，所述第五编码序列为各元素值均为所述第二比特值的二进制比特序列，且结构集中的各部件间结构关系分别与所述第五编码序列中的各元素一一对应，所述结构集为所述汉字信息库中所有汉字所包含的部件间结构关系构成的集合；
将所述第四编码序列和所述第六编码序列进行拼接，得到所述汉字对应的编码。

9.一种汉字识别装置，其特征在于，包括：
接收模块，用于接收客户端发送的待识别图像；
第一确定模块，用于确定所述接收模块接收到的所述待识别图像中待识别文字行的特征向量组，其中，所述特征向量组中各特征向量的维度为汉字信息库中所有汉字所包含的部件数和部件间结构关系数之和，所述特征向量中的各元素为所述所有汉字所包含的部件或部件间结构关系对应的概率值，所述部件包括偏旁和部首；
转化模块，用于根据预设规则，将所述第一确定模块得到的所述特征向量组中的非零元素转化为0或1，得到新的特征向量组...

【专利技术属性】
技术研发人员：周多友，王长虎，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人