一种题目的识别方法技术

技术编号:43034325 阅读:30 留言:0更新日期:2024-10-18 17:36
本申请公开了一种题目的识别方法,涉及图像数据处理领域,包括:获取图像数据;采用基于连通区域分析算法对图像数据进行划分,得到多个切片图像,每个切片图像仅包含单个题目图像;采用基于文本行间距、字体大小和文本框位置的算法提取切片图像的题目特征,题目特征包含题型和选项个数;根据提取的题目特征,采用贝叶斯分类算法对切片图像进行分类;采用光学字符识别算法提取图像数据中的公式信息;利用数学公式识别算法将提取的公式信息转换为MathML或LaTeX格式的数据;对分类后的切片图像中的公式信息进行修正。针对现有技术中存在的题目区域提取精度低问题,本申请通过图像分割、特征提取和公式修正等,提高了题目识别的精度。

【技术实现步骤摘要】

本申请涉及图像数据处理领域,特别涉及一种题目的识别方法


技术介绍

1、图像分割技术和字符识别技术的发展为题目图像的处理与识别提供了技术支持。区域生长、基于边缘检测的分割以及基于聚类的分割等算法的提出,可以实现对题目图像的有效分割。光学字符识别技术的进步,使得可以自动识别题目文本和公式信息。这些都是实现题目识别系统的重要基础。

2、目前的题目识别系统在分割题目区域时效果不佳,无法有效分割出包含完整题目信息的区域,导致后续特征提取和识别都受到影响。而对于含有公式的题目,系统中也缺乏对公式信息进行校验和纠正的步骤,直接影响最终的识别质量。

3、在相关技术中,比如中国专利文献cn112861864a中提供了题目录入方法包括以下步骤:获取初始图片;获取第一图片中的题目位置信息,得到题目图片;获得题目字符信息;判断题库中是否有匹配题目字符信息的题目;对题目文本进行结构化文本解析以获得题型描述特征,对所述题目图片进行识别以获得排版格式特征与试题特征,所述题型描述特征、所述排版格式特征与所述试题特征为所述题目结构化数据;发送题目结构化数据至智能终本文档来自技高网...

【技术保护点】

1.一种题目的识别方法,包括:

2.根据权利要求1所述的题目的识别方法,其特征在于:

3.根据权利要求2所述的题目的识别方法,其特征在于:

4.根据权利要求3所述的题目的识别方法,其特征在于:

5.根据权利要求4所述的题目的识别方法,其特征在于:

6.根据权利要求5所述的题目的识别方法,其特征在于:

7.根据权利要求6所述的题目的识别方法,其特征在于:

8.根据权利要求7所述的题目的识别方法,其特征在于:

9.根据权利要求8所述的题目的识别方法,其特征在于:

10.根据权利要求9所...

【技术特征摘要】

1.一种题目的识别方法,包括:

2.根据权利要求1所述的题目的识别方法,其特征在于:

3.根据权利要求2所述的题目的识别方法,其特征在于:

4.根据权利要求3所述的题目的识别方法,其特征在于:

5.根据权利要求4所述的题目的识别方法,其特征在于:

6.根...

【专利技术属性】
技术研发人员:王晖方明明
申请(专利权)人:上海智慧知到网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1