基于机器智能的题库生产方法及系统技术方案

技术编号:23315568 阅读:29 留言:0更新日期:2020-02-11 17:58
本发明专利技术提供了一种基于机器智能的题库生产方法及系统。所述方法包括:通过版本还原技术,将试卷的图像文件转换为word文件;通过自动识别技术,由所述word文件中识别出所述试卷中试题的层次结构;通过BERT模型,提取所述层次结构中蕴含的知识点。本发明专利技术提供的基于机器智能的题库生产方法及系统大幅提高了题库生产线的效率,降低了人工成本,提高了自动化规模。

Production method and system of question bank based on machine intelligence

【技术实现步骤摘要】
基于机器智能的题库生产方法及系统
本专利技术涉及人工智能
,特别是涉及一种基于机器智能的题库生产方法及系统。
技术介绍
在在线教育企业,教研老师们生产题目的过程中,基本都是依靠人工录入题目。人工录入题目需要教研老师对不同渠道得到的试卷,题目照片,文档等通过系统进行录入。每到生产季,需要大量的教研人员来进行题目的录入工作。导致每道题目的录入人力成本很高,同时存在录入失误的情况。为了降低人为录入失误的风险,还需要投入人力对题目进行逐道审核。题目录入的方式与可靠性,对教育企业的生产成本和生产时间有着较大的影响。设计一套可以自动化识别图片,文档并且可以智能录题的系统,是在线教育企业的必然需求。目前的采用word插件的形式提供了两种处理方式:第一种是使用word作为编辑器为网页提供富文本编辑,这种方式类似常见的富文本网页编辑器,如文本,图像,公式等需要逐个剪贴,细粒度的操作频次很高,并且会导致学科大量的知识资产以word的形式存放;第二种是批量导入试题功能,需要人工按照规定的格式准备好文档,再进行试题的导入。r>这两种处理方式在本文档来自技高网...

【技术保护点】
1.一种基于机器智能的题库生产方法,其特征在于,包括:/n通过版本还原技术,将试卷的图像文件转换为word文件;/n通过自动识别技术,由所述word文件中识别出所述试卷中试题的层次结构;/n通过BERT模型,提取所述层次结构中蕴含的知识点。/n

【技术特征摘要】
1.一种基于机器智能的题库生产方法,其特征在于,包括:
通过版本还原技术,将试卷的图像文件转换为word文件;
通过自动识别技术,由所述word文件中识别出所述试卷中试题的层次结构;
通过BERT模型,提取所述层次结构中蕴含的知识点。


2.根据权利要求1所述的基于机器智能的题库生产方法,其特征在于,通过版本还原技术,将试卷的图像文件转换为word文件,包括:
对所述图像文件进行预处理;
对预处理后的图像文件进行检测、识别;
对检测、识别得到的结果进行后处理。


3.根据权利要求2所述的基于机器智能的题库生产方法,其特征在于,所述预处理包括:双栏分割、旋转校正、大小调整。


4.根据权利要求2所述的基于机器智能的题库生产方法,其特征在于,对检测、识别得到的结果进行后处理,包括:
根据检测的坐标信息合并识别的文本、Latex公式及图表。


5.根据权利要求1所述的基于机器智能的题库生产方法,其特征在于,通过自动识别技术,由所述word文件中识别出所述试卷中试题的层次结构,包括:
将word文档转换为T语言文件;
将T语言文件输入至Antlr解析模块,获得语法树,所述语法树表示试卷中试题的层次结构;
通过遍历语法树,获得试题集的业务对象json数据结构。


6.根据权利要求1所述的基于机器智能的题库生产方法,其特征在于,所述BER...

【专利技术属性】
技术研发人员:周云须佶成李川刘岩雷光化任悦超
申请(专利权)人:北京爱学习博乐教育科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1