字符识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：26599175 阅读：27 留言：0更新日期：2020-12-04 21:21

本申请公开了字符识别方法、装置、系统、电子设备及存储介质，涉及人工智能、图像识别、文本处理、文字识别、计算机视觉、深度学习等领域。具体实现方案为：在从实时采集的第一帧图像中识别到第一类手势的情况下，基于第一模型从所述第一帧图像之后实时采集的帧图像中检测指尖的当前位置信息；基于所述指尖的当前位置信息更新所述指尖的当前轨迹数据；基于第二模型对所述指尖的所述当前轨迹数据进行处理，得到目标字符。

全部详细技术资料下载

【技术实现步骤摘要】
字符识别方法、装置、电子设备及存储介质
本申请涉及计算机
本申请尤其涉及人工智能、图像识别、文本处理、文字识别、计算机视觉、深度学习等领域。
技术介绍
在当今人工智能、物联网和人机交互、虚拟现实、增强现实等应用场景下，手机、电视、户外电子屏、可穿戴设备等都常常需要提供汉字输入功能。传统汉字输入方式通常需要通过用户与设备直接接触，这类输入方式大多需要用户与设备、遥控等直接接触，无法满足使用无接触输入的场景的要求，因此，需要提供一种用户在一定距离内无接触的方式进行手写字符输入的方法。然而在这种方法中，如何使得字符的识别更加准确以及效率更高就成为需要解决的问题。
技术实现思路
本公开提供了一种字符识别方法、装置、电子设备及存储介质。根据本公开的第一方面，提供了一种字符识别方法，包括：在从实时采集的第一帧图像中识别到第一类手势的情况下，基于第一模型从所述第一帧图像之后实时采集的帧图像中检测指尖的当前位置信息；基于所述指尖的当前位置信息更新所述指尖的当前轨迹数据；基于第二模型...

【技术保护点】
1.一种字符识别方法，包括：/n在从实时采集的第一帧图像中识别到第一类手势的情况下，基于第一模型从所述第一帧图像之后实时采集的帧图像中检测指尖的当前位置信息；/n基于所述指尖的当前位置信息更新所述指尖的当前轨迹数据；/n基于第二模型对所述指尖的所述当前轨迹数据进行处理，得到目标字符。/n

【技术特征摘要】
1.一种字符识别方法，包括：
在从实时采集的第一帧图像中识别到第一类手势的情况下，基于第一模型从所述第一帧图像之后实时采集的帧图像中检测指尖的当前位置信息；
基于所述指尖的当前位置信息更新所述指尖的当前轨迹数据；
基于第二模型对所述指尖的所述当前轨迹数据进行处理，得到目标字符。

2.根据权利要求1所述的方法，其中，所述基于第二模型对所述指尖的所述当前轨迹数据进行处理，得到目标字符，还包括：
若从实时采集的第二帧图像中识别到第二类手势，则基于第二模型对所述指尖的所述当前轨迹数据进行识别，得到目标字符。

3.根据权利要求1所述的方法，其中，所述基于第二模型对所述指尖的所述当前轨迹数据进行处理，得到目标字符，还包括：
基于第二模型对所述指尖的所述当前轨迹数据进行预测，得到当前轨迹数据对应的候选字符；
在展示界面中展示所述候选字符；
若从实时采集的第三帧图像中识别到第三类手势，则将从所述第三帧图像中识别到的手部的区域位置所对应的候选字符作为所述目标字符。

4.根据权利要求1-3任一项所述的方法，其中，所述方法还包括：
基于第一模型从实时采集的帧图像中识别手部的区域位置、手势类型、指尖的位置信息中至少之一。

5.根据权利要求1-3任一项所述的方法，其中，所述方法还包括：
获取第一类训练数据；其中，所述第一类训练数据中包含标注有手部的区域位置、手势类型、指尖的位置信息的视频的帧图像；
基于所述第一类训练数据对第一模型进行迭代训练，得到迭代训练后的第一模型。

6.根据权利要求1-3任一项所述的方法，其中，所述方法还包括：
获取第二类训练数据；其中，所述第二类训练数据包括：标注有对应的字符的训练视频、以及所述训练视频中的帧图像所对应的指尖的位置信息组成的轨迹数据；
采用所述第二类训练数据对第二模型进行迭代训练，得到迭代训练后的第二模型。

7.一种字符识别装置，包括：
第一识别模块，用于在从实时采集的第一帧图像中识别到第一类手势的情况下，基于第一模型从所述第一帧图像之后实...

【专利技术属性】
技术研发人员：朱欤，郭国栋，伍天意，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人