一种基于语义相似度区间的主观题自动评分系统及方法技术方案

技术编号:10272939 阅读:209 留言:0更新日期:2014-07-31 15:01
本发明专利技术公开了一种基于语义相似度区间的主观题自动评分系统及方法,该基于语义相似度区间的主观题自动评分方法包括以下步骤:初始化待评分题目分值Stotal;定义字块长度L;将参考答案切分成若干个长度不大于L的字块,形成参考答案字块集R;将待评答案切分成若干个长度不大于L的字块,形成待评答案字块集T;比较集合R、T,计算二者语义的相似度SRT;将SRT映射到相似度区间,记录评分为Sfinal,评分结束;该基于语义相似度区间的主观题自动评分系统包括:答题终端、主观题阅卷模块、考试成绩生成模块。本发明专利技术对主观题的自动阅卷、评分环节,可实现按语义相似度阈值对主观题答案进行等级划分,进而通过分值约束以及各等级相似度分值化给出最终评分。

【技术实现步骤摘要】
一种基于语义相似度区间的主观题自动评分系统及方法
本专利技术属于教育教学考试
,尤其涉及一种基于语义相似度区间的主观题自动评分系统及方法。
技术介绍
目前,在现有考试形式中,考卷中主观题(如论述题等)占一定比例。对主观题答案的评定判分将直接影响到考卷最终得分,因此,要求对主观题的评分过程具有较为合理的规范约束。人工阅卷评分方式易受到多因素干扰,使评分结果带有一定主观性。基于智能信息处理方法,特别是中文信息处理技术,研究对主观题答案的客观评分方法和模型,是解决主观干扰影响评分过程的有效途径。
技术实现思路
本专利技术实施例的目的在于提供一种基于语义相似度区间的主观题自动评分系统及方法,旨在解决现有考试中主观题判定采用人工阅卷存在的以主观意愿为主,很难保证公平公正的问题。本专利技术实施例是这样实现的,一种基于语义相似度区间的主观题自动评分方法,该基于语义相似度区间的主观题自动评分方法包括以下步骤:步骤一,初始化待评分题目分值Strtal ;步骤二,定义字块长度L ;步骤三,将参考答案切分成若干个长度不大于L的字块,形成参考答案字块集R ;步骤四,将待评答案切分成若干个长度不大于L的字块,形成待评答案字块集T ;步骤五,比较集合R、T,计算二者语义的相似度Skt ;步骤六,将Skt映射到相似度区间,记录评分为Sfinal,评分结束。进一步,在步骤六中,分为五个区间,具体为:区间I:Sf^1=SetXWi XUSfinal〈Llower ,则 SfinaI L]_ower, 记录评分为 Sfinal, 评分结束,若 Sfinal ^ L]_ower, 则记录评分为 Sfinal, 评分结束;_3]区间 II:Sfinal=SETXffn XSttrtal,记录评分为 Sfinal,评分结束;_4]区间III:Sfinal=SETXffm X Stotal,记录评分为 Sfinal,评分结束;_5]区间IV:Sfinal=SmXWw XSttrtal,记录评分为 Sfinal,评分结束;区间V:Sfinal=SETXffv X Stotal,若 Sfinal>Lupper,则 Sfinal=Lupper,记录评分为 Sfinal,评分结束;若Sfinal ( Luppot,则记录评分为Sfinal, 评分结束。进一步,该基于语义相似度区间的主观题自动评分方法通过分值约束以及语义相似度、语义相似度阈值和相似度分值化给出最终评分。进一步,分值约束是为了避免出现自动评分的结果大于主观题应得分值Strtal、或小于O分等无效分值或异常情况,设置评分分值上限Luppct和分值下限L1ot?,用来限定并确保评分结果Sfinal e [Lupper, Llower],通常可以令Luppot等于Stotal,令Llrara等于O。进一步,语义相似度得出的具体方法为:以语义相似度表征待评答案与参考答案的一致程度,按照同样的分词词典,对待评答案与参考答案进行字块切分,字块是不大于某一特定长度L的一串相邻文字,字块长度的确定要考虑被切分后的一串相邻文字所表达的语义的相对完整性,参考答案被切分后,形成参考答案字块集R ;待评答案被切分后,形成待评答案字块集T,比较集合R与集合T,通过计算词的相似度和字的相似度,无需按照分词词典切分,加上相应的系数,得到两个集合的语义相似度Skt。进一步,语义相似度阈值的定义为:采用基于语句表面特征的相似度的计算方法,语义相似度的取值总是符合Set e [O, I]的规律,定义语义相似度阈值TiJi e [0,I],以4个阈值为例,i = {1,2, 3,4},且有T1 < T2 < T3 < T4,即T4表示的相似度最高,T1最低,相似度阈值将相似度划分为i+1个区间,若定义4个阈值,则形成了 5个相似度区间。进一步,5个相似度区间为:区间1:SKT≤T1 ;区间II =T1 < Skt≤T2 ;区间III =T2<Set ≤ T3 ;区间IV =T3 < Set ≤T4 ;区间 V:SET > T4。进一步,相似度分值化的具体方法为:待评答案与参考答案的语义相似度越高,得分也越高,不同区间,分值随相似度增加的速度不同,区间标号越大,表明相似度越高,分值随相似度增加越明显,因此,对各区间赋予不同权值Wi,权值随区间标号增大而增加,且各权值均介于O与I之间,以5个区间为例,有 Wi e [O, 1],且 i = { I,II,III,IV,V },W 丨 < Wu< Wm< Ww< Wv,被映射到某一区间的相似度Skt与最终评分Sfinal的函数关系满足下式:Sfinal — Set X Wi X Stotal记录相似度分值化后的结果,即完成一次评分过程。本专利技术实施例的另一目的在于提供一种基于语义相似度区间的主观题自动评分系统,该基于语义相似度区间的主观题自动评分系统包括:答题终端、主观题阅卷模块、考试成绩生成模块;用于实现答题者参加考试,得出客观题答案和主观题答案的答题终端;与答题终端连接,用于接收答题终端的主观题答案,并按照评分标准形成包含所有待评目标得分的主观题评分结果集合的主观题阅卷模块;与主观题阅卷模块连接,用于将主观题阅卷模块形成的评分结果集合生成最终考试成绩的考试成绩生成模块;进一步,该基于语义相似度区间的主观题自动评分系统设置有多个答题终端。本专利技术提供的基于语义相似度区间的主观题自动评分系统及方法,通过设置答题终端、主观题阅卷模块、考试成绩生成模块实现了审阅主观题的飞人工阅卷,严格按照评判的标准阅卷,排除了人工阅卷收干扰的问题,同时提高了阅卷的质量,保证了开始的公平和公正。本专利技术对主观题的自动阅卷、评分环节,可实现按语义相似度阈值对主观题答案进行等级划分,进而通过分值约束以及各等级相似度分值化给出最终评分。【附图说明】图1是本专利技术实施例提供的基于语义相似度区间的主观题自动评分方法的流程图;图2是本专利技术实施例提供的基于语义相似度区间的主观题自动评分系统的结构示意图;图中:1、答题终端;2、主观题阅卷模块;3、考试成绩生成模块;图3是本专利技术实施例提供的基于语义相似度区间的主观题自动评分系统的具体实施例的不意图;图4是本专利技术实施例提供的基于语义相似度区间的主观题自动评分方法的具体实现流程图。【具体实施方式】为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。下面结合附图及具体实施例对本专利技术的应用原理作进一步描述。如图1所示,本专利技术实施例的基于语义相似度区间的主观题自动评分方法包括以下步骤:SlOl:初始化待评分 题目分值Stotal ;S102:定义字块长度L ;S103:将参考答案切分成若干个长度不大于L的字块,形成参考答案字块集R ;S104:将待评答案切分成若干个长度不大于L的字块,形成待评答案字块集T ;S105:比较集合R、T,计算二者语义的相似度Skt ;S106:将Set映射到相似度区间,记录评分为Sfinal,评分结束。在步骤S106中,分为五个区间,具体为:区间1: Sfin本文档来自技高网...

【技术保护点】
一种基于语义相似度区间的主观题自动评分方法,其特征在于,该基于语义相似度区间的主观题自动评分方法包括以下步骤:步骤一,初始化待评分题目分值Stotal,分值Stotal为试卷中主观题的额定分值,是主观题评分的基值,分值Stotal与答案匹配度共同决定最终评分结果;步骤二,定义字块长度L,依据该长度对参考和待评答案进行切分;L越长,评分时答案匹配度高的可能性越小,即得分越少;L越短,评分时答案匹配度高的可能性越大,即得分越多;步骤三,将参考答案切分成若干个长度不大于L的字块,形成参考答案字块集R,由于参考答案、评分标准惟一,字块集R在评分过程中是固定的,用于与待评答案字块集做比较,以给出答案匹配度;步骤四,将待评答案切分成若干个长度不大于L的字块,形成待评答案字块集T,由于答题人对主观题做出的解答在文字上可能有不同,字块集T在评分过程中可能是动态变化的,用于与参考答案字块集做比较,以给出答案匹配度;步骤五,比较集合R、T,计算集合R、T语义的相似度SRT;步骤六,将SRT映射到相似度区间,与待评分题目分值Stotal做计算,共同生成主观题的评分,并记录主观题总评分Sfinal,评分结束。

【技术特征摘要】
1.一种基于语义相似度区间的主观题自动评分方法,其特征在于,该基于语义相似度区间的主观题自动评分方法包括以下步骤: 步骤一, 初始化待评分题目分值Sttrtal,分值Stotal为试卷中主观题的额定分值,是主观题评分的基值,分值Strtal与答案匹配度共同决定最终评分结果; 步骤二,定义字块长度L,依据该长度对参考和待评答案进行切分;L越长,评分时答案匹配度高的可能性越小,即得分越少;L越短,评分时答案匹配度高的可能性越大,即得分越多; 步骤三,将参考答案切分成若干个长度不大于L的字块,形成参考答案字块集R,由于参考答案、评分标准惟一,字块集R在评分过程中是固定的,用于与待评答案字块集做比较,以给出答案匹配度; 步骤四,将待评答案切分成若干个长度不大于L的字块,形成待评答案字块集T,由于答题人对主观题做出的解答在文字上可能有不同,字块集T在评分过程中可能是动态变化的,用于与参考答案字块集做比较,以给出答案匹配度; 步骤五,比较集合R、T,计算集合R、T语义的相似度Skt ; 步骤六,将Skt映射到相似度区间,与待评分题目分值Sttrtal做计算,共同生成主观题的评分,并记录主观题总评分Sfinal,评分结束。2.如权利要求1所述的基于语义相似度区间的主观题自动评分方法,其特征在于,在步骤六中,分为五个区间,具体为:区间 I =Sfinal=SmXW1 XSt otai,^ Sfinai〈Liower,贝丨J SfinaI L]_ower, 记录评分为 Sfinal, 评分结束,若 Sfinal ^ L]_ower, 则记录评分为 Sfinal, 评分结束; 区间II =Sfinal=SmXW11 XSttrtal,记录评分为Sfinal,评分结束; 区间II1:sfinal=sKTxwm XSttrtal,记录评分为Sfinal,评分结束; 区间IV:Sfinal=SKTXWw XSttrtal,记录评分为Sfinal,评分结束;区间 V:Sfinal=SmXWv XStotal,若 Sfinal>LuppOT,则 Sfinal=Luppw,记录评分为 Sfinal,评分结束;若Sfinal ( Luppot,则记录评分为 Sfinal, 评分结束。3.如权利要求1所述的基于语义相似度区间的主观题自动评分方法,其特征在于,该基于语义相似度区间的主观题自动评分方法通过分值约束以及语义相似度、语义相似度阈值和相似度分值化给出最终评分。4.如权利要求3所述的基于语义相似度区间的主观题自动评分方法,其特征在于,分值约束是为了避免出现自动评分的结果大于主观题应得分值Stotal、或小于O分等无效分值或异常情况,设置评分分值上限Luppct和分值下限Llrara,用来限定并确保评分结果SfinaI ^ [Lupper,Llower],通吊可以令 Lupper 等于 ^total, 令L lower 等于O。5.如权利要求3所...

【专利技术属性】
技术研发人员:禹玥昀林宏
申请(专利权)人:西南林业大学
类型:发明
国别省市:云南;53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1