一种自动生成错题本的方法及系统技术方案

技术编号:7472394 阅读:296 留言:0更新日期:2012-07-02 15:04
本发明专利技术公开了一种自动生成错题本的方法及系统,其中,所述方法包括:获取电子版试题图片;所述试题图片中包含文字,所述文字包括印刷体文字及手写体文字;从所述试题图片中提取文字特征;将所述提取的文字特征与预置的文字特征库进行比对,区分出其中的印刷体文字及手写体文字;将所述手写体文字从所述试题图片中擦除,生成不包含手写体文字的试题图片,以便根据包含手写体文字的试题图片和不包含手写体文字的试题图片,自动生成错题本。通过本发明专利技术,能够根据电子版试题图片生成不包含手写体字符的试题图片,进而自动生成错题本。

【技术实现步骤摘要】

本专利技术涉及图像数据处理
,特别是涉及一种自动生成错题本的方法及系统
技术介绍
“错题本”是指中小学学生在学习过程中,把自己做过的作业、习题、试卷中的错题整理成册,便于找出自己学习中的薄弱环节,使得学习重点突出、学习更加有针对性、进而提高学习效率提高学习成绩。“错题本”是自身错误的系统汇总,当把错误汇总在一起的时候,就会很容易看出其中的规律性。另一方面,“错题本”还能改变学生对错误的态度,对待错题的态度是减少错题的关键;因为错误才能使学生知道自己的不足,而不能因为错题少或错误的原因简单而忽视它。一个错误实际就是一个盲点。如果对待错误的态度不积极, 或者缺乏理想的方式解决错误,错误会在任何可能的时候发生,而且会经常重复发生。可见,“错题本”对于学生而言是很重要的。但是,要想制作“错题本”,则要求学生每次考试、练习后,将错误的题目抄在一个特殊的本上。因为要占用较多的时间,且工作量较大,大部分的学生难以坚持。扫描技术或者照相技术能够将纸质试卷或练习册等转换成电子版的试题图片,这为对试卷的自动化处理提供了前提。但是一些试题是填空题的形式,还有一些试题有多个小题,使得电子版的试题图片中带有学生答案或者老师的阅卷痕迹,不符合制作错题本的要求。因此,需要从电子版试题图片中将学生的答案及老师的阅卷痕迹去掉,只保留题目内容本身。但是,现有技术尚没有相应的解决方案。因此,迫切需要本领域技术人员解决的技术问题在于,如何根据电子版的试题图片,生成不包含手写体字符的试题图片,以便提高制作错题本的效率。
技术实现思路
本专利技术提供一种自动生成错题本的方法及系统,能够根据电子版试题图片生成不包含手写体字符的试题图片,进而自动生成错题本。本专利技术提供了如下方案一种自动生成错题本的方法,包括获取电子版试题图片;所述试题图片中包含文字,所述文字包括印刷体文字及手写体文字;从所述试题图片中提取文字特征;将所述提取的文字特征与预置的文字特征库进行比对,区分出其中的印刷体文字及手写体文字;将所述手写体文字从所述试题图片中擦除,生成不包含手写体文字的试题图片, 以便根据包含手写体文字的试题图片和不包含手写体文字的试题图片,自动生成错题本。其中,所述将所述提取的文字特征与预置的文字特征库进行比对包括将所述提取的文字特征与预置的印刷体文字特征库进行比对,将符合所述印刷体文字特征库的文字确定为印刷体文字,其余文字确定为手写体文字。其中,所述将所述提取的文字特征与预置的文字特征库进行比对包括将所述提取的文字特征与预置的手写体文字特征库进行比对,将符合所述手写体文字特征库的文字确定为手写体文字,其余文字确定为印刷体文字。其中,所述从所述试题图片中提取文字特征包括从所述试题图片中提取各个文字的笔画构造特征;禾口/ 或,从所述试题图片中提取各个相邻文字所占的区域特征。其中,所述笔画构造特征包括上下边界弯曲度特征及横竖笔画特征。其中,还包括针对指定的所有考生建立公共试卷库,以便在公共试卷库中查看所有试卷的所有试题信息,并对试题按指定条件进行查询。一种自动生成错题本的系统,包括图片获取单元,用于获取电子版试题图片;所述试题图片中包含文字,所述文字包括印刷体文字及手写体文字;特征提取单元,用于从所述试题图片中提取文字特征;文字区分单元,用于将所述提取的文字特征与预置的文字特征库进行比对,区分出其中的印刷体文字及手写体文字;生成单元,用于将所述手写体文字从所述试题图片中擦除,生成不包含手写体文字的试题图片,以便根据包含手写体文字的试题图片和不包含手写体文字的试题图片,自动生成错题本。其中,所述文字区分单元包括第一区分子单元,用于将所述提取的文字特征与预置的印刷体文字特征库进行比对,将符合所述印刷体文字特征库的文字确定为印刷体文字,其余文字确定为手写体文字。其中,所述文字区分单元包括第二区分子单元,用于将所述提取的文字特征与预置的手写体文字特征库进行比对,将符合所述手写体文字特征库的文字确定为手写体文字,其余文字确定为印刷体文字。其中,所述特征提取单元包括第一提取子单元,用于从所述试题图片中提取各个文字的笔画构造特征;和/ 或,第二提取子单元,用于从所述试题图片中提取各个相邻文字所占的区域特征。其中,所述笔画构造特征包括上下边界弯曲度特征及横竖笔画特征。其中,还包括信息共享单元,用于针对指定的所有考生建立公共试卷库,以便在公共试卷库中查看所有试卷的所有试题信息,并对试题按指定条件进行查询。根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果本专利技术根据试卷中打印体与手写体字符之间文字特征的不同,来区分打印体与手写体,并将手写体字符所在像素点的颜色修改为背景色,这样,图片中就不再包含手写体字符,而只剩下打印体字符,即试题的题目内容。而错题本就是要求只有题目内容,而不包括答题或阅卷痕迹,因此,该方法有利于自动生成错题本。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的方法的流程图;图2是本专利技术实施例提供的系统的示意图。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本专利技术保护的范围。参见图1,本专利技术实施例提供的自动生成错题本的方法包括以下步骤SlOl 获取电子版试题图片;所述试题图片中包含文字,所述文字包括印刷体试题文字及手写体答案文字;其中,可以利用扫描仪对纸质试卷进行扫描得到电子版试题图片,或者,也可以采用数码相机等进行拍照,得到电子版试题图片。为方便描述,下面均以扫描为例进行介绍。由于仅是针对错误的题目生成错题本,而对于一张试卷而言,通常不是每道题都错误,因此,扫描时可以不必扫描整张试卷,而是仅扫描试卷中答错的试题部分即可。关于这种部分扫描的技术,现有技术能够实现,因此这里不再赘述。总之,可以采用多种方法,获取到电子版试题图片。一个试题图片对应一个答错的试题,并且该电子版试题图片中既包含题目内容,又包含有答题痕迹和/或阅卷痕迹。在生成错题本时,通常需要把试卷中的答题痕迹和/或阅卷痕迹去掉,以便学生能够重新作答, 因此,本专利技术实施例需要解决的问题就在于如何将电子版试题图片中的答题痕迹和/或阅卷痕迹去掉,仅留下题目内容。这样,将处理过的试题图片保存在系统中,学生就可以在系统中查找到整理过的错题,而不用再用手抄的方式来制作错题本。要想将电子版试题图片中的答题痕迹和/或阅卷痕迹去掉,仅留下题目内容,准确地区分出题目内容与答题痕迹和/或阅卷痕迹是比较关键的;即如果能够区分出题目内容与答题痕迹和/或阅卷痕迹,则将答题痕迹和/或阅卷痕迹去掉即可。但是具体实现时, 区分出题目内容与答题痕迹和/或阅卷痕迹是比较复杂的。为解决该问题,本专利技术实施例中采用了如下方法利用字符的文字特征来区分打印体和手写体。即,实际应用中,试卷中的题目都是打印体,而答题痕迹和/或阅卷痕迹都是手写体本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:段民兴
申请(专利权)人:北京商纳科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术