Word文档电子试卷的手写笔迹识别方法及计算机可读存储介质技术

技术编号:23315539 阅读:97 留言:0更新日期:2020-02-11 17:57
本发明专利技术涉及电子试卷答题数据识别技术领域,尤其是一种计算机可读存储介质,其存储有计算机程序,该计算机程序被处理执行时实现Word文档电子试卷的手写笔迹识别方法。将Word转化为rtf并提取全部笔迹的shape格式数据,将提取的每个笔迹的shape格式数据替换为一个无损图片,将该图片加入rtf文档的文档流,以提取的时间顺序按照颜色ARGB分量为全部图片id编号,获取每张图片相对于RichTextBox控件窗口所在的真实坐标,根据每张图片的id编号对应其所在shape的相对坐标,换算成该笔迹的轨迹坐标。跳过组卷和格式转化步骤,直接以Word文档形式发布已有试卷。批改后保持Word标准文档格式不变,每份学生的试卷能有效保存,且能以任何通用文档工具打开。

Handwritten handwriting recognition method and computer readable storage medium for electronic test paper of word document

【技术实现步骤摘要】
Word文档电子试卷的手写笔迹识别方法及计算机可读存储介质
本专利技术涉及电子试卷答题数据识别
,尤其是一种计算机可读存储介质,其存储有计算机程序,该计算机程序被处理执行时实现Word文档电子试卷的手写笔迹识别方法。
技术介绍
在信息化、数字化、知识化爆炸式发展的时代,智慧学校的建设势在必行,空前迫切。而智慧教育变革的核心内容中,作业、考试的电子化是相当关键的一环,包括将纸质试卷扫描转化成电子批阅方式、将机读卡变成电子表格、以平板电脑作为答题工具等,这些措施都对教学效率的提升有较大影响。目前,电子试卷的主要实现方式为:学校自行录入或购买一个大型电子题库,老师需要发布作业或制作试卷时从题库选题,如果没有题库,则需要老师每次都手动输入全部试题。老师选题完成之后,根据题目顺序等条件进行组卷,将多道试题打包成一张试卷,再将本试卷以Word、网页或者图片形式发布到学生平板、学习机等终端。学生在专用App内进行操作完成作答,答题完成后试卷回传到批阅系统进行自动批阅或提供给老师批阅。通常来说,网页和图片形式的试卷都是在网页界面能够自动识别答案或根据图片来完成电子批阅。而转化成Word后,需要学生打印成纸质试卷使用,在学生作答后,通过扫描仪对纸质试卷扫描以完成自动批改等功能。现有技术有几大问题,首先是准备工作非常繁重,通常教师都能通过各种途径获得一整份试卷或者已经有大量的电子试卷(通过调查,初中学校的全部电子试卷一般会达到存储量500MB或者总份数500份左右)。而且,教师也不愿意在一个千万数量级的题库里通过大量试卷设计一套自己满意的试卷,通常教师对一个学期里需要用到的精题都是很熟悉的,且都保存在自己的电脑上。此时让教师自主选题组卷其实是增加了工作。其次,一般都需要安装指定app才能完成自动批改功能;或者通过扫描仪对纸质试卷扫描,操作复杂,而且精准度也是问题。最后,不管什么方式,学生做题后,试卷要么还是传统的纸质试卷,要么电子试卷只能存在于特定的企业的服务器里,不是通用格式(如word),不方便学生使用。
技术实现思路
本专利技术的目的是提供一种可直接在电子批阅器中实现的Word文档电子试卷的手写笔迹识别方法。为此,提供一种Word文档电子试卷的手写笔迹识别方法,包括以下步骤:(1)提取笔迹,将Word转化为rtf或xml格式并从中提取全部笔迹的shape格式数据;(2)根据rtf文档格式定义,将提取的每个笔迹的shape格式数据替换为一个无损图片,所述无损图片的像素值小于预设值;(3)将所述图片加入rtf文档的文档流的对应笔迹所在的位置,并以提取的时间顺序按照颜色的ARGB分量编码依次为全部图片id编号;(4)将编号后的rtf文档导入RichTextBox控件,获取每张图片相对于控件窗口所在的真实坐标,再根据每张图片的id编号对应其所在shape的相对坐标,换算该笔迹的轨迹坐标。其中,所述无损图片编号的颜色ARGB分量占用32bit,以其中预设位数作为一个id,剩余部分作为校验位。其中,把图片的校验位的值按8位2进制取补码作为校验码,用于图片读取的校验。其中,所述无损图片编号的颜色ARGB分量中的alpha通道保持为0。其中,根据rtf文档的行高和字体大小来判断笔记中字符所在的像素范围,从而确定笔迹聚集的轨迹范围为同一答题范围。其中,对于每一条笔迹,根据笔迹的轨迹坐标记录其覆盖的行,若两条笔迹覆盖的行重合度达到预设值,则两条笔迹视为一组。其中,对于每一条笔迹,根据坐标记录其覆盖的行,若两条笔迹覆盖的行完全重合,则两条笔迹视为一组。其中,对于一组笔迹,若组内的两条笔迹之间的水平距离低于预设倍数的普通字符宽度,则视为属于一道试题,否则视为同一行的不同试题。其中,若两条笔迹覆盖的行完全重合,且两条笔迹之间的水平距离低于预设倍数的普通字符宽度,则视为属于一道试题。还提供一种计算机可读存储介质,该存储介质存储有可执行计算机程序,计算机程序被控制器执行时能够实现上述Word文档电子试卷的手写笔迹识别方法。本专利技术通过,实现以下有益效果:(1)跳过从数据库组卷和格式转化步骤,直接以Word文档形式发布老师根据自己日常记录得到的试卷。(2)在word文档中直接作答,无需下载其他软件,便于使用。通过该笔迹识别方法识别笔迹可以准确定位笔迹在word中的位置,使得在批改完成后,批改后的笔迹输出到word中能够保持Word标准文档格式不变,每份学生的试卷能有效保存,且能以任何通用文档工具打开。附图说明图1是该Word文档电子试卷的手写笔迹识别方法的流程图。具体实施方式结合以下实施例对该Word文档电子试卷的手写笔迹识别方法作进一步描述。Word电子试卷之所以很难直接作为试卷使用,是因为答案输入存在较严重的问题,如果采用字符串输入,数学公式输入是很难的,也非常影响学生做题效率,至于连线题,画几何图形,就更加不可能。同时,因为输入的字符串和原有的试题对系统来说都是一样的字符串,因此如果不做特殊处理,系统是无法区分哪些是试题,哪些是学生填写的答案。最后真实笔迹是具有签名效果的,如果采用字符串输入,则更容易作弊。通过Word的墨迹手写功能可以解决公式以及笔迹输入问题,由于试题原档不存在墨迹手写数据,因此所有的墨迹数据都可以视为学生的答题内容,而所有的平板显然都是有触屏的,因此都可以实现手写输入(高品质的平板有更好的书写效果,专用手写笔能实现真实手写功能还原)。同时,所有的标准Word工具(office,wps等),也均支持手写功能,因此,只要能提取和解析手写数据,则客户端不需要额外开发做题工具,教师也无需特别准备试卷,只要把Word文档发送给学生,学生再以手写方式完成做题并提交给教师,再用本专利的方式进行分析和批改,则可完成整个作业或考试过程。教师收到学生提交回来的所有试卷后,对全部试卷进行笔迹数据提取。在提取每一份试卷的笔迹时,利用Word或第三方工具将Word转化为rtf或xml格式(两者同Word文档本质是一样的)并从中提取shape格式数据。Word是采用rtf规范的文档,笔迹轨迹数据都会有pInkData字段,该字段包含svb数据,svb数据由16进制byte数组(即buf)组成,墨迹手写功能通过buf中的二进制数据可直接转化为微软笔迹数据。这个笔迹数据有所有的点、坐标、粗细,都可以用微软自带的api进行笔迹识别。上述笔迹识别方式为数据转化的常规格式,在此不做赘述。该Word文档电子试卷的手写笔迹识别方法提供如下笔迹定位方法。笔迹数据保存在文档中时,并不存在绝对坐标系,因此是无法直接获得笔迹的位置的。在rtf文档内,shape的坐标都是相对其所在段落(Paragraph)的坐标,也就说shape的坐标属于相对坐标,而不是相对于整个Word文档的绝对坐标,又由于一个shape只保存一条笔迹,且这些shape可能属于不同的段落,本文档来自技高网
...

【技术保护点】
1.Word文档电子试卷的手写笔迹识别方法,其特征是,包括以下步骤:/n(1)提取笔迹,将Word转化为rtf或xml格式并从中提取全部笔迹的shape格式数据;/n(2)根据rtf文档格式定义,将提取的每个笔迹的shape格式数据替换为一个无损图片,所述无损图片的像素值小于预设值;/n(3)将所述图片加入rtf文档的文档流的对应笔迹所在的位置,并以提取的时间顺序按照颜色的ARGB分量编码依次为全部图片id编号;/n(4)将编号后的rtf文档导入RichTextBox控件,获取每张图片相对于控件窗口所在的真实坐标,再根据每张图片的id编号对应其所在shape的相对坐标,换算该笔迹的轨迹坐标。/n

【技术特征摘要】
1.Word文档电子试卷的手写笔迹识别方法,其特征是,包括以下步骤:
(1)提取笔迹,将Word转化为rtf或xml格式并从中提取全部笔迹的shape格式数据;
(2)根据rtf文档格式定义,将提取的每个笔迹的shape格式数据替换为一个无损图片,所述无损图片的像素值小于预设值;
(3)将所述图片加入rtf文档的文档流的对应笔迹所在的位置,并以提取的时间顺序按照颜色的ARGB分量编码依次为全部图片id编号;
(4)将编号后的rtf文档导入RichTextBox控件,获取每张图片相对于控件窗口所在的真实坐标,再根据每张图片的id编号对应其所在shape的相对坐标,换算该笔迹的轨迹坐标。


2.根据权利要求1所述的Word文档电子试卷的手写笔迹识别方法,其特征是,所述无损图片编号的颜色ARGB分量的数据占用32bit,预设其中的多个位数作为id,剩余位数作为校验位。


3.根据权利要求2所述的Word文档电子试卷的手写笔迹识别方法,其特征是,把图片的校验位的值按8位2进制取补码作为校验码,用于图片读取的校验。


4.根据权利要求2所述的Word文档电子试卷的手写笔迹识别方法,其特征是,所述无损图片编号的颜色ARGB分量中的alpha通道保持为0。
...

【专利技术属性】
技术研发人员:袁野李康单江涛郑志强
申请(专利权)人:广东墨痕教育科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1