试题匹配及试题拆分方法、装置和计算机存储介质制造方法及图纸

技术编号：26342693 阅读：28 留言：0更新日期：2020-11-13 20:36

一种试题匹配及试题拆分方法、装置和计算机存储介质，包括划分目标文本获得文本区块序列，执行分区步骤以生成覆盖文本区块序列中的初始文本区块的数据分区，并根据数据分区从多个预设标准试题中确定当前匹配试题以及数据分区的文本相似度值，执行区块匹配步骤以基于数据分区的文本相似度值判断文本区块序列中位于数据分区之后的待识别文本区块是否与当前匹配试题相匹配，若匹配，则将待识别文本区块并入数据分区并继续执行区块匹配步骤，若不匹配，则将待识别文本区块作为初始文本区块并继续执行分区步骤。本申请实施例通过动态规划方式匹配并拆分试题，可以提高试题匹配及拆分的准确度并能降低算法复杂度以降低设备运行负载。

全部详细技术资料下载

【技术实现步骤摘要】
试题匹配及试题拆分方法、装置和计算机存储介质
本专利技术实施例涉及计算机数据处理领域，尤其涉及一种试题匹配及其试题拆分方法、装置和计算机存储介质。
技术介绍
阅卷是一种重复工作，在日常阅卷过程中，我们只需要一套正确的试卷答案即可批改其他所有卷子。目前业界通常采用文字检测技术以及文字识别技术来实现阅卷工作的自动化，不仅可将老师从大量的重复工作中解放出来，亦能提高阅卷工作效率，其中，试卷拆题作业的准确与否则直接影响着自动阅卷准确率的高低。目前，当需要针对试卷进行切题操作时，一般是通过原有试卷模板上的定位块坐标识别扫描目标试卷图片来实现。然而，由于试卷尺寸的不同以及试卷位置不正等因素均会造成定位块坐标产生变更，此导致了现有自动拆题技术存在着准确性不高且处理效率低下等问题。
技术实现思路
有鉴于此，本专利技术实施例所解决的技术问题之一在于提供一种试题匹配及试题拆分方法、装置和计算机存储介质，可通过动态规划方式匹配试题，提高试题切分的准确度并降低设备运行负载。根据本专利技术的第一方面，提供了一种试题...

【技术保护点】
1.一种试题匹配方法，其特征在于，所述方法包括：/n根据预设划分规则划分目标文本，获得包括多个文本区块的文本区块序列；/n执行分区步骤，生成覆盖所述文本区块序列中作为初始文本区块的所述文本区块的数据分区；/n执行当前匹配试题确定步骤，根据所述数据分区，从多个预设标准试题中确定一个所述预设标准试题作为当前匹配试题，并根据所述当前匹配试题确定所述数据分区的文本相似度值；/n执行区块匹配步骤，将所述文本区块序列中接续位于所述数据分区之后的一个所述文本区块作为待识别文本区块，并根据所述数据分区的文本相似度值，获得所述待识别文本区块与所述当前匹配试题之间的匹配结果；其中，/n若所述待识别文本区块与所述当...

【技术特征摘要】
1.一种试题匹配方法，其特征在于，所述方法包括：
根据预设划分规则划分目标文本，获得包括多个文本区块的文本区块序列；
执行分区步骤，生成覆盖所述文本区块序列中作为初始文本区块的所述文本区块的数据分区；
执行当前匹配试题确定步骤，根据所述数据分区，从多个预设标准试题中确定一个所述预设标准试题作为当前匹配试题，并根据所述当前匹配试题确定所述数据分区的文本相似度值；
执行区块匹配步骤，将所述文本区块序列中接续位于所述数据分区之后的一个所述文本区块作为待识别文本区块，并根据所述数据分区的文本相似度值，获得所述待识别文本区块与所述当前匹配试题之间的匹配结果；其中，
若所述待识别文本区块与所述当前匹配试题相匹配，将所述待识别文本区块并入所述数据分区中以更新所述数据分区，并确定已更新的所述数据分区的文本相似度值，进而执行所述区块匹配步骤；
若所述待识别文本区块与所述当前匹配试题不匹配，将所述待识别文本区块作为所述文本区块序列中的所述初始文本区块，进而执行所述分区步骤，直至所述文本区块序列中所有所述文本区块均执行完毕。

2.根据权利要求1所述的试题匹配方法，其特征在于，所述根据预设划分规则划分目标文本，获得包括多个文本区块的文本区块序列包括：
根据所述目标文本中的横行划分所述目标文本，获得包括多个所述文本区块的所述文本区块序列；其中，各所述文本区块各自包括所述目标文本中的至少一行所述横行。

3.根据权利要求1所述的试题匹配方法，其特征在于，所述根据预设划分规则划分目标文本，获得包括多个文本区块的文本区块序列包括：
根据所述目标文本中的标题信息、罗马字符信息、页码信息中的至少一个划分所述目标文本，获得多个初分块文本；以及
根据各所述初分块文本中的横行划分各所述初分块文本，获得对应于各所述初分块文本的各所述文本区块序列。

4.根据权利要求1所述的试题匹配方法，其特征在于，所述方法还包括：
将所述文本区块序列中的第一个所述文本区块作为所述初始文本区块；或者，
根据预设指令，将所述文本区块序列中满足所述预设指令的所述文本区块作为所述初始文本区块。

5.根据权利要求1所述的试题匹配方法，其特征在于，所述执行当前匹配试题确定步骤，根据所述数据分区，从多个预设标准试题中确定一个所述预设标准试题作为当前匹配试题，并根据所述当前匹配试题确定所述数据分区的文本相似度值包括：
计算各所述预设标准试题与所述数据分区之间的文本相似度，获得对应于各所述预设标准试题的各文本相似度值；
根据对应于各所述预设标准试题的各文本相似度值，确定所述文本相似度值最高的所述预设标准试题以作为所述当前匹配试题；
将所述当前匹配试题的所述文本相似度值确定为所述数据分区的所述文本相似度值。

6.根据权利要求5所述的试题匹配方法，其特征在于，所述计算各所述预设标准试题与所述数据分区之间的文本相似度，获得对应于各所述预设标准试题的各文本相似度值包括：
根据各所述预设标准试题各自包含的各第一字符串信息与所述数据分区包含的第二字符串信息，获得各所述预设标准试题与所述数据分区之间的各最长公共子序列；以及
根据各所述最长公共子序列和所述第二字符串信息，计算各所述预设标准试题与所述数据分区之间的文本相似度，获得对应于各所述预设标准试题的各文本相似度值。

7.根据权利要求5所述的试题匹配方法，其特征在于，所述执行区块匹配步骤，将所述文本区块序列中接续位于所述数据分区之后的一个所述文本区块作为待识别文本区块，并根据所述数据分区的文本相似度值，获得所述待识别文本区块与所述当前匹配试题之间的匹配结果包括：
将所述文本区块序列中接续位于所述数据分区之后的一个所述文本区块作为待识别文本区块，合并所述数据分区与所述待识别文本区块以生成合并分区；
计算所述合并分区与所述当前匹配试题之间的文本相似度，获得所述合并分区的文本相似度值；
计算所述合并分区的文本相似度值与所述数据分区的文本相似度值之间的差值，并将所述差值与预设阈值进行比对，若所述差值未超过所述预设阈值，获得所述待识别文本区块与所述当前匹配试题相匹配的结果，若所述差值超过所述预设阈值，获得所述待识别文本区块与所述当前匹配试题不匹配的结果。

8.根据权利要求7所述的试题匹配方法，其特征在于，所述计算所述合并分区与所述当前匹配试题之间的文本相似度，获得所述合并分区的文本相似度值包括：
根据所述合并分区包含的第三字符串信息和所述当前匹配标准试题包含的第一字符串信息，获得所述合并分区与所述当前匹配试题之间的最长公共子序列；
根据所述最长公共子序列和所述第三字...

【专利技术属性】
技术研发人员：高佳妮，单海蛟，薛志毅，
申请(专利权)人：北京世纪好未来教育科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人