一种基于大数据云平台的题目转化系统技术方案

技术编号:37445024 阅读:23 留言:0更新日期:2023-05-06 09:16
本发明专利技术涉及图形数据识别领域,尤其涉及一种基于大数据云平台的题目转化系统,本发明专利技术通过设置数据库模块、数据交互模块以及数据处理模块,数据库模块包括了若干数据库,用以存储不同字体类型的样本文字轮廓,数据处理模块基于文字轮廓的字体类型判定最优数据库,基于最优数据库识别文字轮廓所表示的文字内容,在无法识别文字轮廓时更换所比对的数据库,且,将最终无法识别的文字轮廓存储至用户端的专属数据库中,通过选定最优数据库,在通过最优数据库无法识别文字轮廓时更换与最优数据库字体数据相似度最高的数据库确定文字轮廓,进而提高文字轮廓识别的效率和准确性,且构建专属数据库提高了用户端后续上传题目文本图片时对文字识别的识别率。对文字识别的识别率。对文字识别的识别率。

【技术实现步骤摘要】
一种基于大数据云平台的题目转化系统


[0001]本专利技术涉及图形数据识别领域,尤其涉及一种基于大数据云平台的题目转化系统。

技术介绍

[0002]随着计算机技术的发展,线上教育技术逐渐被普及,各类线上教育云平台应运而生,现有的线上教育云平台附带有多种功能,例如,线上授课、线上作业批改、大数据课程定制等,广受用户欢迎,其中,线上作业批改需手动输入答案或对纸质作业进行文本识别,因此,文本识别的效率和准确性至关重要。
[0003]中国专利公开号:CN111814798A,公开了一种题目数字化处理方法,包括:采集题目图片;将题目图片进行文本行检测,并对文本行检测结果进行文本识别,得到文本行;将题目图片进行公式符号检测,并对公式符号检测结果进行处理,得到公式块;将文本行、公式块进行图文图表识别;将文本行、公式块以及图文图表识别结果按照行关系排序并输出,得到题目数字化结果。通过该专利技术提供的题目数字化处理方法,对题目图片的识别抗干扰能力强,题目数字化处理的准确率更高,并且处理速度快,使用方便,提高了学习效率,并为教师节省大量时间,客户体验度高。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于大数据云平台的题目转化系统,其特征在于,包括:数据库模块,其包括若干数据库以及若干专属数据库,各所述数据库对应不同的字体类型,用以存储对应字体类型的样本文字轮廓,各所述专属数据库用以存储用户端专有的样本文字轮廓;数据交互模块,其用以获取用户端上传至云平台的题目文本图片;数据处理模块,其包括相互连接的图像解析单元,第一对照单元、第二对照单元以及数据库构建单元,所述图像解析单元与所述数据交互模块连接,用以提取所述题目文本图片中的文字轮廓,并对各所述文字轮廓进行随机筛选,确定已筛选出文字轮廓所属的字体类型,并确定各字体类型的占比,基于占比最高的字体类型判定最优数据库;所述第一对照单元与所述数据库模块连接,用以获取所述图像解析单元已提取的若干文字轮廓,将各所述文字轮廓与所述用户端的专属数据库以及所述最优数据库中的各样本文字轮廓进行比对,根据比对结果识别各所述文字轮廓所表示的文字内容;所述第二对照单元与所述数据库模块连接,用以获取所述第一对照单元无法识别文字内容的文字轮廓,将各数据库与所述最优数据库的字体数据相似度进行降序排序,并基于排序结果逐个选取数据库将各所述无法识别文字内容的文字轮廓与所选取数据库中的样本文字轮廓进行比对,根据比对结果识别各所述文字轮廓所表示的文字内容;所述数据库构建单元与所述数据库模块以及数据交互模块连接,其用以获取所述第二对照单元无法识别的文字轮廓并通过数据交互模块将各所述文字轮廓发送至用户端确定各所述文字轮廓所表示的文字内容,所述用户端确认完毕后,将各所述文字轮廓作为样本文字轮廓存储至所述用户端的专属数据库中。2.根据权利要求1所述的基于大数据云平台的题目转化系统,其特征在于,所述图像解析单元内设置有比例区间[20%,40%],所述图像解析单元进行随机筛选时所筛选出的文字轮廓占文字轮廓总量的占比应属于比例区间[20%,40%]。3.根据权利要求1所述的基于大数据云平台的题目转化系统,其特征在于,所述图像解析单元计算已筛选出文字轮廓与各数据库中样本文字轮廓的相似度,确定相似度最高的样本文字轮廓,确定所述样本文字轮廓所属的数据库,将所述数据库对应的字体类型确定为所述已筛选出文字轮廓所属的字体类型。4.根据权利要求3所述的基于大数据云平台的题目转化系统,其特征在于,所述图像解析单元确定已筛选出文字轮廓所属的字体类型,按照公式(1)计算各字体类...

【专利技术属性】
技术研发人员:祁建春
申请(专利权)人:北京思想天下教育科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1