System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种校园智慧纸笔的文本识别方法及系统技术方案_技高网

一种校园智慧纸笔的文本识别方法及系统技术方案

技术编号:41091624 阅读:2 留言:0更新日期:2024-04-25 13:51
本发明专利技术涉及文本识别领域,尤其涉及一种校园智慧纸笔的文本识别方法及系统,包括实时获取所述纸笔的执行指令;当收到所述执行指令时,获取所述纸笔在书写过程中的行为数据;将所述行为数据转化为图像数据,通过连通域检测算法来获取所述图像数据的字符区域;通过轮廓检测所述字符区域的边界,根据所述边界将所述图像数据中的字符进行字符分割,得到文本区域;识别所述文本区别的字符进行特征提取和匹配,识别出字符内容;基于所述字符内容,通过预设的合成方法将所述字符内容整合成文本信息。通过将行为数据转化为图像数据,并采用连通域检测算法和轮廓检测算法,能够在较低精度的摄像头和较差的光照条件下,获取到较高质量的图像数据。

【技术实现步骤摘要】

本申请涉及到文本识别,特别是涉及到一种校园智慧纸笔的文本识别方法及系统


技术介绍

1、随着信息技术的发展,校园智慧纸笔作为一种新型的智能教育工具,逐渐受到教育行业的关注。校园智慧纸笔能够将学生在纸上的书写内容实时转化为电子文本,方便教师对学生的学习情况进行实时监控和分析。目前,校园智慧纸笔的文本识别技术主要基于图像处理和机器学习算法。

2、现有技术中,在将行为数据转化为图像数据的过程中,现有的技术往往依赖于高精度的摄像头和良好的光照条件,以确保获取到清晰的图像数据。然而,在实际应用场景中,由于摄像头质量、光线条件等因素的限制,导致图像数据质量不高,进而影响后续的字符识别准确率;其次,现有的技术往往依赖于边缘检测算法,如canny算子等。然而,这些算法对于字符的连笔、倾斜等书写特点的适应性较差,容易导致字符识别错误。

3、因此,现有技术存在缺陷,需要改进。


技术实现思路

1、为了解决现有技术中的一个或者几个问题,本申请的主要目的为提供一种校园智慧纸笔的文本识别方法及系统。

2、为了实现上述专利技术目的,本申请提出一种校园智慧纸笔的文本识别方法,所述方法包括:

3、实时获取所述纸笔的执行指令;

4、当收到所述执行指令时,获取所述纸笔在书写过程中的行为数据;

5、将所述行为数据转化为图像数据,通过连通域检测算法来获取所述图像数据的字符区域;

6、通过轮廓检测所述字符区域的边界,根据所述边界将所述图像数据中的字符进行字符分割,得到文本区域;

7、识别所述文本区别的字符进行特征提取和匹配,识别出字符内容;

8、基于所述字符内容,通过预设的合成方法将所述字符内容整合成文本信息。

9、进一步地,所述将所述行为数据转化为图像数据,通过连通域检测算法来获取所述图像数据的字符区域,包括:

10、接收所述纸笔的行为数据,所述行为数据包括笔在纸上的移动轨迹、速度及压力信息;

11、将所述行为数据进行预处理并转化成特征向量;

12、将所述特征向量输入预设的模型中,通过预设的模型识别所述特征向量并输出图像数据,所述图像数据包括所述移动轨迹映射到特定的像素值上;

13、通过连通域检测算法识别所述图像数据中的单个字符区域和/或多个字符区域;

14、基于所述单个字符区域和/或多个字符区域,得到字符数据。

15、进一步地,所述通过轮廓检测所述字符区域的边界,根据所述边界将所述图像数据中的字符进行字符分割,得到文本区域,包括:

16、通过轮廓检测算法识别每个字符区域的字符边界;

17、对所述字符边界的边界坐标进行识别;

18、根据所述边界坐标,将所述字符边界沿着边界坐标进行分割,得到分割后的单独的字符图像;

19、识别每个字符图像,将每个所述字符图像按照预设的排序方式进行组合,得到文本区域。

20、进一步地,所述对所述字符边界的边界坐标进行识别,包括:

21、对提取的轮廓进行跟踪,以识别字符的边界;

22、判断所述字符的边界是否闭合;

23、当所述字符的边界出现未闭合时,对所述字符边界进行未闭合的端点进行识别;

24、通过预设的工具填充所述未闭合的端点,再对闭合后的所述字符边界进行去噪平滑处理;

25、基于处理后的所述字符边界,获取边界点标记坐标。

26、进一步地,所述基于所述字符内容,通过预设的合成方法将所述字符内容整合成文本信息包括:

27、对每个字符内容进行特征提取,对每个提取的特征进行归一化处理,用于将每个特征控制在预设的数值范围内;

28、对归一化后的每个特征向量通过元素乘法进行元素相乘,得到新特征向量;

29、将所有所述新特征向量进行拼接融合,并输入已训练的文本生成模型中,得到最终文本信息。

30、进一步地,所述移动轨迹映射到特定的像素值上包括,包括:

31、获取所述移动轨迹在纸上的坐标系;

32、识别所述移动轨迹在纸上的坐标系,根据识别结果构建虚拟空间坐标系;

33、将所述移动轨迹按照所述虚拟空间坐标系映射到特定的像素值上。

34、进一步地,所述通过连通域检测算法识别所述图像数据中的单个字符区域和/或多个字符区域包括:

35、识别所述图像数据中的亮度信息,根据预设的第一阈值,将所述图像数据中亮度大于第一阈值的图像分割为背景;

36、根据预设的第二阈值,将图像数据中亮度小于第二阈值的图像分割为字符区域;

37、提取所述字符区域,对所述字符区域进行连通域标记,将相邻的像素组成一个连通域;

38、对所有所述连通域按照预设的筛选方式进行筛选,得到最终的单个字符区域和/或多个字符区域,其中所述筛选方式包括根据连通域的大小、宽高比及紧凑度。

39、本申请实施例还提供一种校园智慧纸笔的文本识别系统,包括:

40、第一获取模块,用于实时获取所述纸笔的执行指令;

41、第二获取模块,用于当收到所述执行指令时,获取所述纸笔在书写过程中的行为数据;

42、转化模块,用于将所述行为数据转化为图像数据,通过连通域检测算法来获取所述图像数据的字符区域;

43、检测模块,用于通过轮廓检测所述字符区域的边界,根据所述边界将所述图像数据中的字符进行字符分割,得到文本区域;

44、识别模块,用于识别所述文本区别的字符进行特征提取和匹配,识别出字符内容;

45、整合模块,用于基于所述字符内容,通过预设的合成方法将所述字符内容整合成文本信息。

46、本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

47、本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

48、本申请实施例的校园智慧纸笔的文本识别方法及系统,通过将行为数据转化为图像数据,并采用连通域检测算法和轮廓检测算法,能够在较低精度的摄像头和较差的光照条件下,获取到较高质量的图像数据,通过轮廓检测技术对字符区域进行边界检测和分割,可以将复杂的图像数据分割成单个字符或多个字符,适应字符的连笔、倾斜等书写特点,有效降低字符识别错误。实时获取和处理书写过程中的行为数据,使得文本识别更加高效。校园智慧纸笔,还可以应用于其他需要文本识别的场景,如电子签名、手写输入等。通过预设的合成方法,将识别出的字符内容整合成文本信息,简化了字符识别的过程,提高了识别效率。通过连通域检测算法来获取图像数据的字符区域,可以有效地将文字与其他背景进行区分,准确地定位文字的位置。

本文档来自技高网...

【技术保护点】

1.一种校园智慧纸笔的文本识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的校园智慧纸笔的文本识别方法,其特征在于,所述将所述行为数据转化为图像数据,通过连通域检测算法来获取所述图像数据的字符区域,包括:

3.根据权利要求1所述的校园智慧纸笔的文本识别方法,其特征在于,所述通过轮廓检测所述字符区域的边界,根据所述边界将所述图像数据中的字符进行字符分割,得到文本区域,包括:

4.根据权利要求3所述的校园智慧纸笔的文本识别方法,其特征在于,所述对所述字符边界的边界坐标进行识别,包括:

5.根据权利要求1所述的校园智慧纸笔的文本识别方法,其特征在于,所述基于所述字符内容,通过预设的合成方法将所述字符内容整合成文本信息包括:

6.根据权利要求2所述的校园智慧纸笔的文本识别方法,其特征在于,所述移动轨迹映射到特定的像素值上,包括:

7.根据权利要求2所述的校园智慧纸笔的文本识别方法,其特征在于,所述通过连通域检测算法识别所述图像数据中的单个字符区域和/或多个字符区域包括:

8.一种校园智慧纸笔的文本识别系统,其特征在于,包括:

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种校园智慧纸笔的文本识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的校园智慧纸笔的文本识别方法,其特征在于,所述将所述行为数据转化为图像数据,通过连通域检测算法来获取所述图像数据的字符区域,包括:

3.根据权利要求1所述的校园智慧纸笔的文本识别方法,其特征在于,所述通过轮廓检测所述字符区域的边界,根据所述边界将所述图像数据中的字符进行字符分割,得到文本区域,包括:

4.根据权利要求3所述的校园智慧纸笔的文本识别方法,其特征在于,所述对所述字符边界的边界坐标进行识别,包括:

5.根据权利要求1所述的校园智慧纸笔的文本识别方法,其特征在于,所述基于所述字符内容,通过预设的合成方法将所述字符内容整合成文...

【专利技术属性】
技术研发人员:徐丹白世亮
申请(专利权)人:广州宏途数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1