一种电子答卷中作文部分的防抄袭识别方法技术

技术编号:19934866 阅读:28 留言:0更新日期:2018-12-29 04:47
一种电子答卷中作文部分的防抄袭识别方法,包括:获取某一学生递交的第一电子答卷;检测所述第一电子答卷中的作文部分是否包括的第一作答文本;若包括所述第一作答文本,根据所述第一电子答卷中包括的所述学生的姓名和班级信息,获取所述学生的相邻同学递交的第二电子答卷;其中,所述第一电子答卷对应的考试科目与所述第二电子答卷的考试科目相同;将所述第一作答文本与所述第二电子答卷中的作文部分包括的第二作答文本进行对比;若对比表明所述第一作答文本与所述第二作答文本近似,分别在所述第一电子答卷和所述第二电子答卷上标注用于表示存在抄袭嫌疑的标记。实施本发明专利技术实施例,能够减少阅卷评分花费的时间,提升阅卷评分的效率。

【技术实现步骤摘要】
一种电子答卷中作文部分的防抄袭识别方法
本专利技术涉及防作弊
,尤其涉及一种电子答卷中作文部分的防抄袭识别方法。
技术介绍
目前,利用平板电脑、个人计算机(PersonalComputer,PC)等电子设备来进行考试的学校、培训机构的数量越来越多。其中,利用平板电脑、个人计算机等电子设备来进行考试时,服务设备可以收集到学生递交的电子答卷,从而可以有效的省去纸张的浪费,实现无纸化考试。在实践中发现,服务设备收集到的学生递交的电子答卷包括的部分内容有时仍需要人工进行阅卷评分。例如,服务设备收集到的学生递交的电子答卷包括的作文部分的作答文本通常需要阅卷人以人工方式进行阅卷评分。对于阅卷人而言,既要对某一学生递交的电子答卷包括的作文部分的作答文本进行人工阅卷,又要对比该学生递交的电子答卷包括的作文部分的作答文本是否与其他学生递交的电子答卷包括的作文部分的作答文本有抄袭嫌疑,导致阅卷评分需要花费大量的时间,影响了阅卷评分的效率。
技术实现思路
本专利技术实施例公开了一种电子答卷中作文部分的防抄袭识别方法,能够减少阅卷评分花费的时间,提升阅卷评分的效率。其中,一种电子答卷中作文部分的防抄袭识别方法,所述方法包括:获取某一学生递交的第一电子答卷;检测所述第一电子答卷中的作文部分是否包括的第一作答文本;若包括所述第一作答文本,根据所述第一电子答卷中包括的所述学生的姓名和班级信息,获取所述学生的相邻同学递交的第二电子答卷;其中,所述第一电子答卷对应的考试科目与所述第二电子答卷的考试科目相同;将所述第一作答文本与所述第二电子答卷中的作文部分包括的第二作答文本进行对比;若对比表明所述第一作答文本与所述第二作答文本近似,分别在所述第一电子答卷和所述第二电子答卷上标注用于表示存在抄袭嫌疑的标记。作为一种可选的实施方式,本专利技术实施例中,所述根据所述第一电子答卷中包括的所述学生的姓名和班级信息,获取所述学生的相邻同学递交的第二电子答卷,包括:根据所述第一电子答卷中包括的所述学生的班级信息,获取所述学生所在班级的座位分布图;所述座位分布图中的每一个座位分布标注有所述座位对应的学生姓名;根据所述第一电子答卷中包括的所述学生的姓名,从所述座位分布图中确定出所述学生的相邻座位对应的同学姓名;获取所述相邻座位对应的同学姓名所属同学递交的第二电子答卷。作为一种可选的实施方式,本专利技术实施例中,所述分别在所述第一电子答卷和所述第二电子答卷上标注用于表示存在抄袭嫌疑的标记之后,所述方法还包括:根据所述第一电子答卷中包括的所述学生的班级信息和所述考试科目,确定出与所述学生的班级信息和所述考试科目同时匹配的科目教师;将所述第一电子答卷和所述第二电子答卷发送至所述科目教师对应的教师客户端,以使所述科目教师通过所述教师客户端进一步确认所述第一电子答卷和所述第二电子答卷之间是否存在抄袭嫌疑。作为一种可选的实施方式,本专利技术实施例中,所述将所述第一作答文本与所述第二电子答卷中的作文部分包括的第二作答文本进行对比,包括:将所述第一作答文本进行拆解得到各候选句子;确定所述各候选句子的重要性分数;从所述各候选句子中提取所述重要性分数大于预设值的目标句子作为所述第一作答文本的关键信息;将所述第一作答文本的关键信息与所述第二电子答卷中的作文部分包括的第二作答文本的关键信息进行对比。作为一种可选的实施方式,本专利技术实施例中,所述将所述第一作答文本进行拆解得到各候选句子,包括:获取预设的文本拆解规则,所述预设的文本拆解规则包括分号、逗号、句号要进行拆解,而顿号、冒号、引号不进行拆解;按照所述预设的文本拆解规则,将所述第一作答文本进行拆解,以得到各候选句子。作为一种可选的实施方式,本专利技术实施例中,所述确定所述各候选句子的重要性分数,包括:针对所述各候选句子中的每一候选句子,如果所述候选句子为中文句子,则按照语义分析的方式将所述中文句子拆分为若干个词组;对拆分得到的每个词组进行全文遍历计算,得到每个词组的出现次数;按照所述出现次数由高到低的顺序对拆分得到的所有词组进行排序,并且每个词组按照所述出现次数赋予相应的权值,所述出现次数越高,所述权值越高;计算每一中文句子的重要性分数,所述重要性分数即为所述中文句子拆分得到的若干个词组的权值之和。作为一种可选的实施方式,本专利技术实施例中,所述防抄袭识别方法还包括:如果所述候选句子为网页链接地址,则在后台开启所述网页链接地址对应的目标网页;根据所述目标网页中,指向所述目标网页的链接确定所述目标网页的重要性分数,所述目标网页的重要性分数即是所述候选句子的重要性分数。作为一种可选的实施方式,本专利技术实施例中,所述确定所述目标网页的重要性分数的过程为:其中,S(Vi)是目标网页的重要性分数,d是阻尼系数,In(Vi)是存在指向目标网页的链接的网页集合,out(Vj)是网页j中的链接存在的链接指向的网页集合,out(Vj)取绝对值是用以表示所述网页集合中元素的个数,S(Vj)是网页j的重要性分数。作为一种可选的实施方式,本专利技术实施例中,所述将所述第一作答文本的关键信息与所述第二电子答卷中的作文部分包括的第二作答文本的关键信息进行对比,包括:计算所述第一作答文本的关键信息中的第一句子与所述第二电子答卷中的作文部分包括的第二作答文本的关键信息的第二句子的余弦相似度;若所述余弦相似度高于指定值,则确定所述第一作答文本与所述第二作答文本近似。作为一种可选的实施方式,本专利技术实施例中,所述余弦相似度的计算过程为:将所述第一句子拆分为若干个词组,以获得一组词组;将所述第二句子拆分为若干个词组,以获得另一组词组;将两组词组中的词组进行逐一对比,若存在,则记录为1,若不存在,则记录为0,以得到第一序列和第二序列;计算所述第一序列和所述第二序列之间的余弦相似度,并作为所述第一句子和所述第二句子之间的余弦相似度;其中,所述计算所述第一序列和所述第二序列之间的余弦相似度为:其中,ab表示a序列中的元素与b序列中相应的元素相乘后整体相加,分母表示a序列中所有元素的平方和开根号后乘以b序列中所有元素的平方和开根号;其中,a序列表示所述第一序列,b序列表示所述第二序列。本专利技术实施例中,在检测到某一学生递交的第一电子答卷中的作文部分包括第一作答文本时,可以根据第一电子答卷中包括的该学生的姓名和班级信息,获取该学生的相邻同学递交的第二电子答卷,第一电子答卷对应的考试科目与第二电子答卷的考试科目相同;而且,若对比第一作答文本与第二电子答卷中的作文部分包括的第二作答文本近似,分别在第一电子答卷和第二电子答卷上标注用于表示存在抄袭嫌疑的标记。实施本专利技术实施例,对于未标注有用于表示存在抄袭嫌疑的标记的电子答卷,阅卷人可以省去对比该电子答卷包括的作文部分的作答文本是否与其他学生递交的电子答卷包括的作文部分的作答文本有抄袭嫌疑的作业,而仅需对比那些标注有用于表示存在抄袭嫌疑的标记的电子答卷之间的作答文本是否有抄袭嫌疑即可,从而可以减少阅卷评分花费的时间,提升阅卷评分的效率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附本文档来自技高网...

【技术保护点】
1.一种电子答卷中作文部分的防抄袭识别方法,其特征在于,所述方法包括:获取某一学生递交的第一电子答卷;检测所述第一电子答卷中的作文部分是否包括的第一作答文本;若包括所述第一作答文本,根据所述第一电子答卷中包括的所述学生的姓名和班级信息,获取所述学生的相邻同学递交的第二电子答卷;其中,所述第一电子答卷对应的考试科目与所述第二电子答卷的考试科目相同;将所述第一作答文本与所述第二电子答卷中的作文部分包括的第二作答文本进行对比;若对比表明所述第一作答文本与所述第二作答文本近似,分别在所述第一电子答卷和所述第二电子答卷上标注用于表示存在抄袭嫌疑的标记。

【技术特征摘要】
1.一种电子答卷中作文部分的防抄袭识别方法,其特征在于,所述方法包括:获取某一学生递交的第一电子答卷;检测所述第一电子答卷中的作文部分是否包括的第一作答文本;若包括所述第一作答文本,根据所述第一电子答卷中包括的所述学生的姓名和班级信息,获取所述学生的相邻同学递交的第二电子答卷;其中,所述第一电子答卷对应的考试科目与所述第二电子答卷的考试科目相同;将所述第一作答文本与所述第二电子答卷中的作文部分包括的第二作答文本进行对比;若对比表明所述第一作答文本与所述第二作答文本近似,分别在所述第一电子答卷和所述第二电子答卷上标注用于表示存在抄袭嫌疑的标记。2.根据权利要求1所述的防抄袭识别方法,其特征在于,所述根据所述第一电子答卷中包括的所述学生的姓名和班级信息,获取所述学生的相邻同学递交的第二电子答卷,包括:根据所述第一电子答卷中包括的所述学生的班级信息,获取所述学生所在班级的座位分布图;所述座位分布图中的每一个座位分布标注有所述座位对应的学生姓名;根据所述第一电子答卷中包括的所述学生的姓名,从所述座位分布图中确定出所述学生的相邻座位对应的同学姓名;获取所述相邻座位对应的同学姓名所属同学递交的第二电子答卷。3.根据权利要求2所述的防抄袭识别方法,其特征在于,所述分别在所述第一电子答卷和所述第二电子答卷上标注用于表示存在抄袭嫌疑的标记之后,所述方法还包括:根据所述第一电子答卷中包括的所述学生的班级信息和所述考试科目,确定出与所述学生的班级信息和所述考试科目同时匹配的科目教师;将所述第一电子答卷和所述第二电子答卷发送至所述科目教师对应的教师客户端,以使所述科目教师通过所述教师客户端进一步确认所述第一电子答卷和所述第二电子答卷之间是否存在抄袭嫌疑。4.根据权利要求1-3任一项所述的防抄袭识别方法,其特征在于,所述将所述第一作答文本与所述第二电子答卷中的作文部分包括的第二作答文本进行对比,包括:将所述第一作答文本进行拆解得到各候选句子;确定所述各候选句子的重要性分数;从所述各候选句子中提取所述重要性分数大于预设值的目标句子作为所述第一作答文本的关键信息;将所述第一作答文本的关键信息与所述第二电子答卷中的作文部分包括的第二作答文本的关键信息进行对比。5.根据权利要求4所述的防抄袭识别方法,其特征在于,所述将所述第一作答文本进行拆解得到各候选句子,包括:获取预设的文本拆解规则,所述预设的文本拆解规则包括分号、逗号、句号要进行拆解,而顿号、冒号、引号不进行拆解;按照所述预设的文本拆解规则,将所述第一作答文本进行拆解...

【专利技术属性】
技术研发人员:向湘杰
申请(专利权)人:东莞市华睿电子科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1