一种题库构建方法技术

技术编号:11287081 阅读:75 留言:0更新日期:2015-04-11 01:53
本发明专利技术公开了一种题库构建方法,该方法包括:收集习题文件,将所述习题文件按照设定格式保存到word源文件中,并将word源文件将保存到指定目录中;根据预设条件对所述指定目录中的word源文件进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中;之后将第一目录中的word源文件转换为html文件,将所述html文件保存到web服务器的指定位置,最后根据数据库服务器的数据存储格式,对所述指定位置的html文件进行解析,并将解析后的数据保存到数据库服务器中。通过本发明专利技术的方法提高了基础题库构建的效率以及题库的质量。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了,该方法包括:收集习题文件,将所述习题文件按照设定格式保存到word源文件中,并将word源文件将保存到指定目录中;根据预设条件对所述指定目录中的word源文件进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中;之后将第一目录中的word源文件转换为html文件,将所述html文件保存到web服务器的指定位置,最后根据数据库服务器的数据存储格式,对所述指定位置的html文件进行解析,并将解析后的数据保存到数据库服务器中。通过本专利技术的方法提高了基础题库构建的效率以及题库的质量。【专利说明】
本专利技术涉及数字化处理
,具体涉及一种基于python语言和java语言的题库构建方法
技术介绍
伴随着计算机技术和网络时代的推进,在线教育产品/系统在人们生活和学习过程中已经得到了越来越多的应用。与此同时,PC端、移动端的一些旨在方便用户针对性练习的辅助类教育系统/产品也越来越丰富。而这些系统,均需要以题库系统作为支撑来展开服务。因此,如何快捷、高效的构建题库系统,成为此类系统中急需解决的问题。 题库系统的建设一般分题目数据采集、题目数据解析、题目数据入库等操作。一般情况,对于IT企业来说,题目数据采集的方式是通过开发基于编辑器的web应用,实现题目数据的在线录入。该方案的缺点是:首先,习题录入时操作流程较为复杂,导致开发成本较高。另外,使用编辑器,只能实现单道题目录入,而且如果题目中包含大量图片,录入操作时效率会非常低,因而导致人力成本较高,而且也不能有效检查错误。
技术实现思路
针对现有技术中存在的缺陷,本专利技术的目的在于提供,提高题库的构建效率和题库的质量。 为实现上述目的,本专利技术采用的技术方案为:,包括以下步骤: (I)收集习题文件,将所述习题文件按照设定格式保存到word源文件中,并将word源文件保存到指定目录中; (2)根据预设条件对所述指定目录中的word源文件进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中; (3)将第一目录中的word源文件转换为html文件,并将所述html文件保存到web服务器的指定位置; (4)根据数据库服务器的数据存储格式,对所述指定位置的html文件进行解析,并将解析后的数据保存到数据库服务器中。 进一步,如上所述的,步骤(3)中,将word源文件转换为html文件的方式为: 将word源文件转换为表格格式文件,将表格格式文件转换为html文件。 进一步,如上所述的,步骤(I)中,所述习题文件包括教师制作的习题。 进一步,如上所述的,步骤(I)中,所述设定格式包括习题属性和习题内容;所述习题属性包括习题的来源、年份、关键字、题型和难度;所述习题内容包括习题、答案和解析。 进一步,如上所述的,步骤(2)中,当word源文件校验失败时,所述方法还包括: 对于检验失败的word源文件生成错误日记; 编辑人员根据所述错误日志对于第二目录中的word源文件进行修改; 对修改后的word文件进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中。 进一步,如上所述的,步骤(4)中,将解析后的数据保存到数据库服务器中是指将解析后的字符数据保存到数据库服务器中;如果解析后的数据包括字符数据和图片数据,则将解析后的图片数据保存到ftp服务器中。 进一步,如上所述的,步骤⑵和步骤(3)中,通过python脚本语言实现对word源文件的校验和文件的转换。 进一步,如上所述的,步骤(4)中,通过java脚本语言实现对html文件的解析。 本专利技术的有益效果在于:本专利技术提供了一种根据word源文件自动校验、提取习题数据并存储的方案,该方案能够批量校验、转化源word文件为目标格式,并且可将转换后的文件批量解析、存储到数据库中,通过本专利技术的方法提高了基础题库构建的效率,且习题数据经校验后,质量明显提高。 【专利附图】【附图说明】 图1为本专利技术实施例中的流程图; 图2为本专利技术实施例中的详细流程图; 图3为本专利技术实施例中word源文件的示意图; 图4为本专利技术实施例中表格格式文件的示意图。 【具体实施方式】 下面结合说明书附图与实施例对本专利技术做进一步的详细说明。 本专利技术是针对现有传统的基于界面录入的习题收集方式效率差的问题,而提出的,该方法能够实现对习题文件的自动验证、数据提取,提高了题库的构建的效率,且能够有效提高题库的质量。 图1和图2示出了本专利技术实施例中的流程图,由图中可以看出,该方法可以包括以下步骤: 步骤Sll:收集习题文件并将习题保存到word源文件中; 本实施例中,首先收集习题文件,将所述习题文件按照设定格式保存到word文件(初始文件,本实施例中称为word源文件)中,并将word源文件将保存到指定目录中。 其中,所述习题文件的来源可以是多种,可以是教师制作的习题、也可以是网络上下载的习题或者课本上的习题等。完成习题的收集后,将习题按照word的设定格式保存到word中,得到word源文件,并将word源文件保存到指定目录中,如可以是保存到计算机D盘名称为“word”的文件夹中,及指定目录的路径为:D: \word。 word的是设定格式可以根据需要进行设定。本实施例中,所述设定格式包括但不限于习题属性和习题内容;所述习题属性可以包括习题的来源、年份、关键字、题型、难度;所述习题内容可以包括习题、答案和解析。当然,习题内容中除了包括字符内容外,还有可能包括图片(如题目中的公式、示例图片或者题目本身所涉及到的一些网络图片等)等。 如图2所示,是针对类型为选择题而设定的一种word格式,格式中包括了习题的来源学校、年份、关键字、题型、难度、题干(具体的习题)、选项、答案及解析。收集到一选择题后,将该选择题按照上述word格式后得到的word源文件如图3所示。 步骤S12:对word源文件进行校验; 完成word源文件的存储后,根据预设条件对所述word源文件进行校验,以提高生成的题库的质量。所述校验指的是对习题的属性和习题内容进行校验。例如,对图2中所示的源文件进行校验,主要是指针对word源文件中习题的题型、难度、题干及选型等信息进行校验。其中,预设条件是根据所需构建的题库的具体内容进行设置的,例如,需要构建的是单选题的题库,题目的来源年份也是设置好的,那么预设条件便可以使判断题目是否为单选,题目的年份是否符合预设年份等。根据预设条件对word源文件进行判断后,如果word源文件中的题目都符合预设条件,则说明检验通过,如果有其中一项或多项不符合,则校验失败。 该步骤中,完成word源文件的校验后,将校验通过的word源文件保存到第一目录,即第一目录为success目录,将校验失败的word源文件保存到第二目录中,即第二目录为failure目录。 此外,本实施例中,如果word源文件没有通过校验,此时根据校验失败的原因(如哪项预设条件检验没通过)对于检验失败的word源文件生成错误日记,以便编辑人员根据所述错误本文档来自技高网
...

【技术保护点】
一种题库构建方法,包括以下步骤:(1)收集习题文件,将所述习题文件按照设定格式保存到word源文件中,并将word源文件保存到指定目录中;(2)根据预设条件对所述指定目录中的word源文件进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中;(3)将第一目录中的word源文件转换为html文件,并将所述html文件保存到web服务器的指定位置;(4)根据数据库服务器的数据存储格式,对所述指定位置的html文件进行解析,并将解析后的数据保存到数据库服务器中。

【技术特征摘要】

【专利技术属性】
技术研发人员:郭浩伟
申请(专利权)人:明博教育科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1