一种校园智慧纸笔的文本识别方法及系统技术方案

技术编号：41091624 阅读：2 留言：0更新日期：2024-04-25 13:51

本发明专利技术涉及文本识别领域，尤其涉及一种校园智慧纸笔的文本识别方法及系统，包括实时获取所述纸笔的执行指令；当收到所述执行指令时，获取所述纸笔在书写过程中的行为数据；将所述行为数据转化为图像数据，通过连通域检测算法来获取所述图像数据的字符区域；通过轮廓检测所述字符区域的边界，根据所述边界将所述图像数据中的字符进行字符分割，得到文本区域；识别所述文本区别的字符进行特征提取和匹配，识别出字符内容；基于所述字符内容，通过预设的合成方法将所述字符内容整合成文本信息。通过将行为数据转化为图像数据，并采用连通域检测算法和轮廓检测算法，能够在较低精度的摄像头和较差的光照条件下，获取到较高质量的图像数据。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及到文本识别，特别是涉及到一种校园智慧纸笔的文本识别方法及系统。

技术介绍

1、随着信息技术的发展，校园智慧纸笔作为一种新型的智能教育工具，逐渐受到教育行业的关注。校园智慧纸笔能够将学生在纸上的书写内容实时转化为电子文本，方便教师对学生的学习情况进行实时监控和分析。目前，校园智慧纸笔的文本识别技术主要基于图像处理和机器学习算法。

2、现有技术中，在将行为数据转化为图像数据的过程中，现有的技术往往依赖于高精度的摄像头和良好的光照条件，以确保获取到清晰的图像数据。然而，在实际应用场景中，由于摄像头质量、光线条件等因素的限制，导致图像数据质量不高，进而影响后续的字符识别准确率；其次，现有的技术往往依赖于边缘检测算法，如canny算子等。然而，这些算法对于字符的连笔、倾斜等书写特点的适应性较差，容易导致字符识别错误。

3、因此，现有技术存在缺陷，需要改进。

技术实现思路

1、为了解决现有技术中的一个或者几个问题，本申请的主要目的为提供一种校园智慧纸笔的文本识别方法及系统。

2、为了实现上述专利技术目的，本申请提出一种校园智慧纸笔的文本识别方法，所述方法包括：

3、实时获取所述纸笔的执行指令；

4、当收到所述执行指令时，获取所述纸笔在书写过程中的行为数据；

5、将所述行为数据转化为图像数据，通过连通域检测算法来获取所述图像数据的字符区域；

6、通过轮廓检测所述字符区域的边界，根据所述边界将所述图像数据

7、识别所述文本区别的字符进行特征提取和匹配，识别出字符内容；

8、基于所述字符内容，通过预设的合成方法将所述字符内容整合成文本信息。

9、进一步地，所述将所述行为数据转化为图像数据，通过连通域检测算法来获取所述图像数据的字符区域，包括：

10、接收所述纸笔的行为数据，所述行为数据包括笔在纸上的移动轨迹、速度及压力信息；

11、将所述行为数据进行预处理并转化成特征向量；

12、将所述特征向量输入预设的模型中，通过预设的模型识别所述特征向量并输出图像数据，所述图像数据包括所述移动轨迹映射到特定的像素值上；

13、通过连通域检测算法识别所述图像数据中的单个字符区域和/或多个字符区域；

14、基于所述单个字符区域和/或多个字符区域，得到字符数据。

15、进一步地，所述通过轮廓检测所述字符区域的边界，根据所述边界将所述图像数据中的字符进行字符分割，得到文本区域，包括：

16、通过轮廓检测算法识别每个字符区域的字符边界；

17、对所述字符边界的边界坐标进行识别；

18、根据所述边界坐标，将所述字符边界沿着边界坐标进行分割，得到分割后的单独的字符图像；

19、识别每个字符图像，将每个所述字符图像按照预设的排序方式进行组合，得到文本区域。

20、进一步地，所述对所述字符边界的边界坐标进行识别，包括：

21、对提取的轮廓进行跟踪，以识别字符的边界；

22、判断所述字符的边界是否闭合；

23、当所述字符的边界出现未闭合时，对所述字符边界进行未闭合的端点进行识别；

24、通过预设的工具填充所述未闭合的端点，再对闭合后的所述字符边界进行去噪平滑处理；

25、基于处理后的所述字符边界，获取边界点标记坐标。

26、进一步地，所述基于所述字符内容，通过预设的合成方法将所述字符内容整合成文本信息包括：

27、对每个字符内容进行特征提取，对每个提取的特征进行归一化处理，用于将每个特征控制在预设的数值范围内；

28、对归一化后的每个特征向量通过元素乘法进行元素相乘，得到新特征向量；

29、将所有所述新特征向量进行拼接融合，并输入已训练的文本生成模型中，得到最终文本信息。

30、进一步地，所述移动轨迹映射到特定的像素值上包括，包括：

31、获取所述移动轨迹在纸上的坐标系；

32、识别所述移动轨迹在纸上的坐标系，根据识别结果构建虚拟空间坐标系；

33、将所述移动轨迹按照所述虚拟空间坐标系映射到特定的像素值上。

34、进一步地，所述通过连通域检测算法识别所述图像数据中的单个字符区域和/或多个字符区域包括：

35、识别所述图像数据中的亮度信息，根据预设的第一阈值，将所述图像数据中亮度大于第一阈值的图像分割为背景；

36、根据预设的第二阈值，将图像数据中亮度小于第二阈值的图像分割为字符区域；

37、提取所述字符区域，对所述字符区域进行连通域标记，将相邻的像素组成一个连通域；

38、对所有所述连通域按照预设的筛选方式进行筛选，得到最终的单个字符区域和/或多个字符区域，其中所述筛选方式包括根据连通域的大小、宽高比及紧凑度。

39、本申请实施例还提供一种校园智慧纸笔的文本识别系统，包括：

40、第一获取模块，用于实时获取所述纸笔的执行指令；

41、第二获取模块，用于当收到所述执行指令时，获取所述纸笔在书写过程中的行为数据；

42、转化模块，用于将所述行为数据转化为图像数据，通过连通域检测算法来获取所述图像数据的字符区域；

43、检测模块，用于通过轮廓检测所述字符区域的边界，根据所述边界将所述图像数据中的字符进行字符分割，得到文本区域；

44、识别模块，用于识别所述文本区别的字符进行特征提取和匹配，识别出字符内容；

45、整合模块，用于基于所述字符内容，通过预设的合成方法将所述字符内容整合成文本信息。

46、本申请还提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

47、本申请还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

48、本申请实施例的校园智慧纸笔的文本识别方法及系统，通过将行为数据转化为图像数据，并采用连通域检测算法和轮廓检测算法，能够在较低精度的摄像头和较差的光照条件下，获取到较高质量的图像数据，通过轮廓检测技术对字符区域进行边界检测和分割，可以将复杂的图像数据分割成单个字符或多个字符，适应字符的连笔、倾斜等书写特点，有效降低字符识别错误。实时获取和处理书写过程中的行为数据，使得文本识别更加高效。校园智慧纸笔，还可以应用于其他需要文本识别的场景，如电子签名、手写输入等。通过预设的合成方法，将识别出的字符内容整合成文本信息，简化了字符识别的过程，提高了识别效率。通过连通域检测算法来获取图像数据的字符区域，可以有效地将文字与其他背景进行区分，准确地定位文字的位置。

本文档来自技高网...

【技术保护点】

1.一种校园智慧纸笔的文本识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的校园智慧纸笔的文本识别方法，其特征在于，所述将所述行为数据转化为图像数据，通过连通域检测算法来获取所述图像数据的字符区域，包括：

3.根据权利要求1所述的校园智慧纸笔的文本识别方法，其特征在于，所述通过轮廓检测所述字符区域的边界，根据所述边界将所述图像数据中的字符进行字符分割，得到文本区域，包括：

4.根据权利要求3所述的校园智慧纸笔的文本识别方法，其特征在于，所述对所述字符边界的边界坐标进行识别，包括：

5.根据权利要求1所述的校园智慧纸笔的文本识别方法，其特征在于，所述基于所述字符内容，通过预设的合成方法将所述字符内容整合成文本信息包括：

6.根据权利要求2所述的校园智慧纸笔的文本识别方法，其特征在于，所述移动轨迹映射到特定的像素值上，包括：

7.根据权利要求2所述的校园智慧纸笔的文本识别方法，其特征在于，所述通过连通域检测算法识别所述图像数据中的单个字符区域和/或多个字符区域包括：

8.一种校园智慧纸笔的

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种校园智慧纸笔的文本识别方法，其特征在于，所述方法包括：

4.根据权利要求3所述的校园智慧纸笔的文本识别方法，其特征在于，所述对所述字符边界的边界坐标进行识别，包括：

5.根据权利要求1所述的校园智慧纸笔的文本识别方法，其特征在于，所述基于所述字符内容，通过预设的合成方法将所述字符内容整合成文...

【专利技术属性】
技术研发人员：徐丹，白世亮，
申请(专利权)人：广州宏途数字科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人