基于文本相似度的非主观题阅卷方法、装置及存储介质制造方法及图纸

技术编号：22022169 阅读：34 留言：0更新日期：2019-09-04 01:16

本发明专利技术涉及一种人工智能技术，揭露了一种基于文本相似度的非主观题阅卷方法，包括：对特定领域的专有词语进行收集汇总，构建特定词汇的文本语料库；获取考试试卷中考生答案的文本内容；根据所述文本语料库，对所述考试试卷的标准答案和考生答案的文本内容按照预先确定的分词规则分别进行分词操作，并产生所述标准答案和考生答案的分词向量；利用预设算法计算所述标准答案和考生答案的分词向量之间的相似度；及从所述分词向量中选择标准答案的得分要点，根据标准答案的得分要点及所述相似度匹配相应的分值，对考生答案中每道非主观题进行智能打分。本发明专利技术还提出一种装置以及一种计算机可读存储介质。本发明专利技术能够实现试卷的精确的智能化评分。

Text Similarity Based Non-Subjective Paper Scoring Method, Device and Storage Media

全部详细技术资料下载

【技术实现步骤摘要】
基于文本相似度的非主观题阅卷方法、装置及存储介质
本专利技术涉及人工智能
，尤其涉及一种基于文本相似度的非主观题阅卷方法、装置及计算机可读存储介质。
技术介绍
考试作为对学习效果和知识掌握程度的一种检验方法，在日常工作和生活中广泛存在。由于各类培训考试人数较多、规模较大，而且人工阅卷中会有很多主观因素影响评分结果，如教师的疲劳程度、心情状态以及考生的字体是否美观等，因此教育和培训机构对于自动阅卷的需求日趋强烈。
技术实现思路
本专利技术提供一种基于文本相似度的非主观题阅卷方法、装置及计算机可读存储介质，其主要目的在于提供一种非主观题阅卷方法，以实现试卷的智能化评分。为实现上述目的，本专利技术的基于文本相似度的非主观题阅卷方法，包括：对特定领域的专有词语进行收集汇总，构建特定词汇的文本语料库；获取考试试卷中考生答案的文本内容；根据所述文本语料库，对所述考试试卷的标准答案和考生答案的文本内容按照预先确定的分词规则分别进行分词操作，并产生所述标准答案和考生答案的分词向量；利用预设算法计算所述标准答案和考生答案的分词向量之间的相似度；及从所述分词向量中选择标准答案的得分要点，根据标准答案的得分要点并结合所述标准答案和考生答案的分词向量之间的相似度匹配相应的分值，对考生答案中每道非主观题进行智能打分。可选地，所述获取考试试卷中考生答案的文本内容包括：针对笔试方式的考试试卷，获取考试试卷的影像图像，识别出所述影像图像中非主观题部分问题的考生答案，并将所述考生答案转换为文本格式，形成所述考生答案的文本内容；及针对机答方式的考试试卷，直接获取所述考生的答案部分，形成所述...

【技术保护点】
1.一种基于文本相似度的非主观题阅卷方法，其特征在于，所述方法包括：对特定领域的专有词语进行收集汇总，构建特定词汇的文本语料库；获取考试试卷中考生答案的文本内容；根据所述文本语料库，对所述考试试卷的标准答案和考生答案的文本内容按照预先确定的分词规则分别进行分词操作，并产生所述标准答案和考生答案的分词向量；利用预设算法计算所述标准答案和考生答案的分词向量之间的相似度；及从所述分词向量中选择标准答案的得分要点，根据标准答案的得分要点并结合所述标准答案和考生答案的分词向量之间的相似度匹配相应的分值，对考生答案中每道非主观题进行智能打分。

【技术特征摘要】
1.一种基于文本相似度的非主观题阅卷方法，其特征在于，所述方法包括：对特定领域的专有词语进行收集汇总，构建特定词汇的文本语料库；获取考试试卷中考生答案的文本内容；根据所述文本语料库，对所述考试试卷的标准答案和考生答案的文本内容按照预先确定的分词规则分别进行分词操作，并产生所述标准答案和考生答案的分词向量；利用预设算法计算所述标准答案和考生答案的分词向量之间的相似度；及从所述分词向量中选择标准答案的得分要点，根据标准答案的得分要点并结合所述标准答案和考生答案的分词向量之间的相似度匹配相应的分值，对考生答案中每道非主观题进行智能打分。2.如权利要求1所述的基于文本相似度的非主观题阅卷方法，其特征在于，所述获取考试试卷中考生答案的文本内容包括：针对笔试方式的考试试卷，获取考试试卷的影像图像，识别出所述影像图像中非主观题部分问题的考生答案，并将所述考生答案转换为文本格式，形成所述考生答案的文本内容；及针对机答方式的考试试卷，直接获取所述考生的答案部分，形成所述考生答案的文本内容。3.如权利要求1所述的基于文本相似度的非主观题阅卷方法，其特征在于，所述预先确定的分词规则包括利用隐性马尔科夫模型和关键词抽取算法对标准答案和考生答案进行文本改写，并利用K-means算法和朴素贝叶斯分类器构建词袋模型，实现分词操作。4.如权利要求1所述的基于文本相似度的非主观题阅卷方法，其特征在于，所述预设算法为余弦相似度算法，公式为：其中，X、Y分别为标准答案和考生答案的分词向量，sim(X,Y)表示标准答案和考生答案的分词向量之间的余弦相似度、范围从-1到1。5.如权利要求1至4中任意一项所述的基于文本相似度的非主观题阅卷方法，其特征在于，所述从所述分词向量中选择标准答案的得分要点，根据标准答案的得分要点并结合所述标准答案和考生答案的分词向量之间的相似度匹配相应的分值，对考生答案中每道非主观题进行智能打分包括：预先设置标准答案的多个得分要点，并针对每个得分要点的重要程度设置各得分要点的分值比重；根据所述标准答案和考生答案的分词向量的相似度，筛选出与所述标准答案的得分要点相匹配的考生答案中的关键词；通过计算考生答案中所有关键词对应的得分要点的分值比重，得到该试卷...

【专利技术属性】
技术研发人员：金戈，徐亮，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人