System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于词法分析反馈的计算题批阅方法及系统技术方案_技高网

一种基于词法分析反馈的计算题批阅方法及系统技术方案

技术编号:40181987 阅读:6 留言:0更新日期:2024-01-26 23:47
本发明专利技术公开了一种基于词法分析反馈的计算题批阅方法及系统,具体步骤包括:S1:获取手写数学计算题图像,对手写数学计算题图像进行答题区域检测,获得答题区域图像;S2:对答题区域图像进行识别,获得带有置信度的算式序列矩阵;S3:根据置信度大小对算式序列矩阵中的算式序列进行排序;S4:对第一候选序列按照设定的词法分析规则进行检验及修正;S5:对经过词法分析规则检验后的第一候选序列进行解析并输入到内置函数中,基于所述内置函数计算并输出最终答题判断结果图像。本发明专利技术基于词法分析规则对候选序列进行检验,并对不符合规则的候选序列进行修正,对修正后的候选序列进行后续解析计算操作,能够提高手写数学计算题识别的准确率。

【技术实现步骤摘要】

本专利技术涉及智能识别阅卷,尤其涉及一种基于词法分析反馈的计算题批阅方法及系统


技术介绍

1、目前针对手写数学公式识别序列修正的方法主要有以下几种方式,分别是基于词法错误直接修正方法以及基于语言模型的计算题纠错方法。其中,基于词法错误直接修正方法是根据计算题特有语义信息的先验知识,人工设置纠错模板,直接对识别错误的信息进行修正,但该方法仅仅使用了识别网络预测的最大概率的结果,没有充分利用识别网络输出的信息,修正能力不强。而基于语言模型的计算题纠错方法通过设计深度学习网络,提前学习大量的计算序列样例,自动学习计算题的语义信息并进行纠错,但是由于手写数学公式中的语义信息较弱,所以模型的纠错能力不强,同时语言模型还存在可能会将正确的序列错纠的问题。


技术实现思路

1、本专利技术提供一种基于词法分析反馈的计算题批阅方法及系统,以克服现有技术在识别出的算式序列不符合语法规则时无法有效解决的技术问题。

2、为了实现上述目的,本专利技术的技术方案是:

3、一种基于词法分析反馈的计算题批阅方法,具体步骤包括:

4、s1:获取手写数学计算题图像,对手写数学计算题图像进行答题区域检测,获得答题区域图像;

5、s2:对答题区域图像进行识别,获得带有置信度的算式序列矩阵;

6、s3:根据置信度大小对算式序列矩阵中的m个算式序列进行排序,并按照置信度从大到小的顺序选取n个算式序列作为候选序列,从而得到第一候选序列,第二候选序列,…,第n候选序列,n≤m,每个候选序列包含相同位数的符号;

7、s4:对第一候选序列按照设定的词法分析规则进行检验;如果第一候选序列中所有的符号都符合词法分析规则,则直接将第一候选序列作为输出序列;

8、否则利用第二候选序列,…,第n候选序列对第一候选序列进行修正,并对修正后的第一候选序列进行检验;若修正后的第一候选序列符合词法分析规则,结束操作,并输出修正后的第一候选序列;若第二候选序列,…,第n候选序列使用完毕后仍无法修正第一候选序列,结束操作,并输出原始的第一候选序列;

9、s5:对经过词法分析规则检验后的第一候选序列进行解析并输入到内置函数中,基于所述内置函数计算并输出最终答题判断结果图像。

10、具体地,s4中,所述词法分析规则包括序列末尾不能出现非数字符号检验规则、序列中不能出现非法连续非数字符号检验规则以及序列中括号不能为奇数检验规则;

11、1)所述序列末尾不能出现非数字符号检验规则为:

12、第一候选序列末尾出现非数字符号,则不符合序列末尾不能出现非数字符号检验规则,此时,第一候选序列需要进行修正;

13、2)所述序列中不能出现非法连续非数字符号检验规则为:

14、第一候选序列中出现两个或两个以上的非法连续非数字符号,则不符合序列中不能出现非法连续非数字符号检验规则,此时,第一候选序列需要进行修正;

15、3)所述序列中括号的数量不能为奇数检验规则为:

16、第一候选序列中括号的数量为奇数,则不符合序列中括号的数量不能为奇数检验规则,此时,第一候选序列需要进行修正。

17、具体地,s4中,如果第一候选序列不符合所述词法分析规则中的任意一个规则或任意两个规则或全部规则,则利用第二候选序列,…,第n候选序列对第一候选序列进行修正,具体过程为:

18、如果第一候选序列不符合序列末尾不能出现非数字符号检验规则,则根据第一候选序列中不符合词法分析规则的符号的位置,依次从第二候选序列,…,第n候选序列中的对应位置查找是否存在代表序列结束的结束符eos,若对应位置存在结束符eos,则用所述结束符eos替换第一候选序列末尾的非数字符号,并重复检验修正过程,直到第一候选序列的末尾为数字或“}”;

19、如果第一候选序列不符合序列中不能出现非法连续非数字符号检验规则,则根据第一候选序列中不符合词法分析规则的符号的位置,依次从第二候选序列,…,第n候选序列中的对应位置查找是否存在使第一候选序列中的非法连续非数字符号变为合法连续非数字符号的符号,所述合法连续非数字符号包括“}#”、“)#”、“#*”、“#+”、“#-”、“#&”以及“#=”,若对应位置存在使非法连续非数字符号变为合法连续非数字符号的符号,则用该符号替换第一候选序列中对应位置的符号;

20、如果第一候选序列不符合序列中括号的数量不能为奇数检验规则,则依次从第二候选序列,…,第n候选序列中的查找是否存在另一半括号“(”或“)”与第一候选序列中缺少的一半括号相对应,若存在“(”或“)”,则用“(”或“)”替换第一候选序列中对应位置的符号。

21、具体地,s5中,对经过词法分析规则检验后的第一候选序列进行解析的过程为:

22、将分数算式表达式中的“\frac{}{}”、余数算式表达式中的“……”、竖式的算式表达式中同时含有“#”和“&”且不含“\sqrt”、竖式除法的算式表达式中同时含有“\sqrt”、“#”和“&”以及脱式的算式表达式中同时含有“#”、“=”作为检测经过词法分析规则检验后的第一候选序列的标识符,若第一候选序列存在对应的标识符,并判定其为对应的算式序列并进行如下处理:

23、若第一候选序列为分数算式序列,则将“\frac{}{}”替换为第一个“{}”和第二个“{}”中的内容相除的形式,然后将第一候选序列中“=”前的部分作为“input”,“=”后的部分作为“output”;

24、若第一候选序列为余数算式序列,则将第一候选序列中的“……”转换为小数点符号“.”,然后将第一候选序列中“=”前的部分作为“input”,“=”后的部分作为“output”;

25、若第一候选序列为竖式算式,则将第一候选序列中被第一个“#”分隔的前两个运算数x1和x2、最后一位运算数x3以及数学运算符号“+”、“-”和“*”提取出来后,将“x1运算符号x2”组成“input”,将x3作为“output”;

26、若第一候选序列为竖式除法算式,则将第一候选序列中被第一个“#”分割的前两个运算数r1和r2,“\sqrt{}”的“{}”中的运算数r3以及最后一位运算数r4提取出来,然后将“r3\r2+r1”组成“input”,将r4作为“output”;

27、若第一候选序列为脱式算式,则将第一候选序列中第一个“#”前面的全部内容d1和最后一个“=”的后面的内容d2提取出来后,将d1作为“input”,将d2作为“output”;

28、若第一候选序列不是以上五种算式,则视为简单算式,并将第一候选序列“=”前的部分作为“input”,“=”后的部分作为“output”,如果没有“=”,则将第一候选序列的全部内容作为“input”。

29、具体地,s5中,基于所述内置函数计算并输出最终答题判断结果图像的过程为:

30、首本文档来自技高网...

【技术保护点】

1.一种基于词法分析反馈的计算题批阅方法,其特征在于,具体步骤包括:

2.根据权利要求1所述的基于词法分析反馈的计算题批阅方法,其特征在于,S4中,所述词法分析规则包括序列末尾不能出现非数字符号检验规则、序列中不能出现非法连续非数字符号检验规则以及序列中括号不能为奇数检验规则;

3.根据权利要求2所述的基于词法分析反馈的计算题批阅方法,其特征在于,S4中,如果第一候选序列不符合所述词法分析规则中的任意一个规则或任意两个规则或全部规则,则利用第二候选序列,…,第N候选序列对第一候选序列进行修正,具体过程为:

4.根据权利要求3所述的基于词法分析反馈的计算题批阅方法,其特征在于,S5中,对经过词法分析规则检验后的第一候选序列进行解析的过程为:

5.根据权利要求4所述的基于词法分析反馈的计算题批阅方法,其特征在于,S5中,基于所述内置函数计算并输出最终答题判断结果图像的过程为:

6.一种基于词法分析反馈的计算题批阅系统,其特征在于,包括答题区域检测模块、数学公式识别模块、候选序列选择模块、词法分析模块和结果检验模块;

<p>7.根据权利要求6所述的基于词法分析反馈的计算题批阅系统,其特征在于,所述结果检验模块包括算式解析模块和计算输出模块;

8.根据权利要求7所述的基于词法分析反馈的计算题批阅系统,其特征在于,所述词法分析规则包括序列末尾不能出现非数字符号检验规则、序列中不能出现非法连续非数字符号检验规则以及序列中括号不能为奇数检验规则;

9.根据权利要求8所述的基于词法分析反馈的计算题批阅系统,其特征在于,如果第一候选序列不符合所述词法分析规则中的任意一个规则或任意两个规则或全部规则,则利用第二候选序列,…,第N候选序列对第一候选序列进行修正,具体过程为:

...

【技术特征摘要】

1.一种基于词法分析反馈的计算题批阅方法,其特征在于,具体步骤包括:

2.根据权利要求1所述的基于词法分析反馈的计算题批阅方法,其特征在于,s4中,所述词法分析规则包括序列末尾不能出现非数字符号检验规则、序列中不能出现非法连续非数字符号检验规则以及序列中括号不能为奇数检验规则;

3.根据权利要求2所述的基于词法分析反馈的计算题批阅方法,其特征在于,s4中,如果第一候选序列不符合所述词法分析规则中的任意一个规则或任意两个规则或全部规则,则利用第二候选序列,…,第n候选序列对第一候选序列进行修正,具体过程为:

4.根据权利要求3所述的基于词法分析反馈的计算题批阅方法,其特征在于,s5中,对经过词法分析规则检验后的第一候选序列进行解析的过程为:

5.根据权利要求4所述的基于词法分析反馈的计算题批阅方法,其特征在于,s5中,基于所述内...

【专利技术属性】
技术研发人员:王新年张曾洋黄鑫
申请(专利权)人:大连海事大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1