一种基于语义分析的课程目标达成情况评价合理性评价的方法技术

技术编号:38090327 阅读:7 留言:0更新日期:2023-07-06 09:01
一种基于语义分析的课程目标达成情况评价合理性评价的方法,包括以下步骤:1)读取课程目标达成情况文档,并对文档进行PDF扫描;2)对PDF扫描件进行区域分割,获得对应区域的初始数据;3)对所述对应区域的初始数据进行OCR扫描,获取对应区域的待检测元数据;4)利用文本匹配算法对待检测元数据进行处理,提取出关键词和关键句,并生成摘要;5)利用文本相似度算法对关键词和关键句进行文本相似度对比,计算关联区域元数据的相似度,并生成报表;6)判断关联区域元数据相似度报表是否存在异常,提取异常处。本发明专利技术解决了传统的人工审计课程目标达成情况评估合理性的方式,减少的所需要消耗的人力、时间成本、以及过多人为的主观影响因素问题。因素问题。因素问题。

【技术实现步骤摘要】
一种基于语义分析的课程目标达成情况评价合理性评价的方法


[0001]本专利技术涉及数据挖掘、自然语言处理领域,具体是一种基于语义分析的课程目标达成情况评价合理性评价的方法。

技术介绍

[0002]在数据挖掘、NLP领域内,如何利用数据关联特征挖掘有价值的信息对于准确地判断相应的数据语义关联至关重要。不同的数据组合会产生不同的语义特征,准确的根据语义判断能够极大提升数据利用率、更好的替代人工判断数据的关联性。
[0003]课程目标的达成情况是学院以及学校考核的重要因素,目前课程目标的达成情况大多都是人工筛选,往往需要消耗大量的人力时间成本来进行人工判定合理性,且由于人的主观性会导致出现一定的误差,考核情况没有统一的标准,对学生和学院及学校造成一定的影响。

技术实现思路

[0004]本专利技术的目的是提供一种基于语义分析的课程目标达成情况评价方法,主要用于解决传统方法对于课程目标达成情况评价合理行评价费时费力的弊端。
[0005]为实现本专利技术目的而采用的技术方案是这样的,一种基于语义分析的课程目标达成情况评价合理性评价的方法,包括以下步骤:
[0006]1)读取课程目标达成情况文档,并对文档进行PDF扫描,得到PDF扫描件。
[0007]2)对PDF扫描件进行区域分割,获得对应区域的初始数据。
[0008]3)对所述对应区域的初始数据进行OCR扫描,获取对应区域的待检测元数据。
[0009]4)利用文本匹配算法对待检测元数据进行处理,提取出关键词和关键句,并生成摘要。
[0010]5)利用文本相似度算法对关键词和关键句进行文本相似度对比,计算关联区域元数据的相似度,并生成关联区域元数据相似度报表。
[0011]6)判断关联区域元数据相似度报表是否存在异常,若是,则评价结果为不合理,否则,评价结果为合理。
[0012]所述异常的判断标准为:对相似度报表内关联区域的相似度进行加权,若加权后的相似度低于阈值,则存在异常,若加权后的相似度不低于阈值,则不存在异常。
[0013]进一步,所述读取课程目标达成情况文档后,对课程目标达成情况文档进行格式归一化处理。
[0014]进一步,在步骤3)中,获取对应区域的待检测元数据后,对其进行预设标准向量化。
[0015]所述预设标准向量化的步骤包括:
[0016]3.1)将待检测元数据进行向量化处理。
[0017]3.2)将向量化的元数据根据文本匹配算法模型的输入做标准化。
[0018]进一步,在步骤4)中,利用文本匹配算法对待检测元数据进行处理,提取出关键词和关键句,并生成摘要的步骤包括:
[0019]4.1)根据历史课程目标达成情况评价文档的元数据向量,构建文本匹配算法模型。
[0020]所述文本匹配算法模型包括关键词抽取模型和关键句抽取模型。
[0021]4.2)将待检测元数据输入到关键词抽取模型中,抽取得到关键词。
[0022]4.3)将待检测元数据输入到关键句抽取模型中,抽取得到关键句。
[0023]进一步,所述关键词抽取模型如下所示:
[0024][0025]式中,为关键词,i1=1,2,

,n,n为关键词数量。为关键词对文本的重要度。a为学习率。为关键词跳转到文本页面,在有向有权图的图中对应入度的点。为关键词跳转到文本页面,在有向有权图的图中对应出度的点。
[0026]进一步,所述关键句抽取模型如公式(2)至公式(5)所示:
[0027][0028][0029][0030][0031]式中,TF

IDF是衡量单个词语在文档中到重要程度,t是关键词词条,i1为关键词序数,i1=1,2,

,n,n为关键词数量。d是文本。TF是词频,表示词条t在文本d中出现到频率。IDF是逆向文件词频。DF是包含词条t的文本数。BM25是在搜索引擎中衡量词语与文档的关联程度,Q是查询语句,包含关键词t1,t2,t3,...,t
n
。D是被检索到的文档,k1和b均为常数字,avgDL为文本的平均长度。V
i
为文本的第i句,i=1,2,

,m,m为文本句子数量。WS(V
i
)是文本第i句V
i
的得分。In(V
i
)为文本第i句V
i
跳转到文本页面,在有向有权图的图中对应入度的点。Out(V
j
)为文本第j句V
i
跳转到文本页面,在有向有权图的图中对应出度的点。
[0032]进一步,所述关键句的抽取的步骤包括:
[0033]4.3.1)通过迭代法求出文本中每一个句子的最终得分。
[0034]4.3.2)根据最终得分,对文本中所有的句子进行降序排列,提取前N个句子,作为
关键句。
[0035]进一步,在步骤5)中,利用文本相似度算法对关键词和关键句进行文本相似度对比,计算关联区域元数据的相似度的步骤包括:
[0036]5.1)根据历史课程目标达成情况评价文档的元数据向量,构建文本相似度算法模型。
[0037]5.2)将关键词输入到文本相似度算法模型中,计算关联区域关键词元数据的相似度。
[0038]5.3)将关键句输入到文本相似度算法模型中,计算关联区域关键句元数据的相似度。
[0039]进一步,所述文本相似度算法模型利用MatchZoo文本匹配工具包来计算关联区域关键词元数据、关联区域关键句元数据的相似度。
[0040]本专利技术的技术效果是毋庸置疑的,本专利技术公开了一种基于语义分析的课程目标达成情况评价合理性评价的方法,本专利技术利用了目前深度学习中NLP方向的文本匹配算法来判断合理性,从而大幅度代替人工筛选,只需要人工把个别机器难以界定的目标合理性把控,即本专利技术的人工复查审计,最终确定课程目标达成情况评价合理性。本专利技术解决了传统的人工审计课程目标达成情况评估合理性的方式,减少的所需要消耗的人力、时间成本、以及过多人为的主观影响因素问题。本专利技术用机器来进行判断,进而实现了标准的统一、减少人力成本以及时间成本的浪费。
附图说明
[0041]图1为本专利技术的流程图。
具体实施方式
[0042]下面结合实施例对本专利技术作进一步说明,但不应该理解为本专利技术上述主题范围仅限于下述实施例。在不脱离本专利技术上述技术思想的情况下,根据本领域普通技术知识和惯用手段,做出各种替换和变更,均应包括在本专利技术的保护范围内。
[0043]实施例1:
[0044]参见图1,一种基于语义分析的课程目标达成情况评价合理性评价的方法,包括以下步骤:
[0045]1)读取课程目标达成情况文档,并对文档进行PDF扫描,得到PDF扫描件。
[0046]2)对PDF扫描件进行区域分割,获得对应区域的初始数据。根据步骤1所得到的PDF扫描件,进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语义分析的课程目标达成情况评价合理性评价的方法,其特征在于,包括以下步骤:1)读取课程目标达成情况文档,并对文档进行PDF扫描,得到PDF扫描件;2)对PDF扫描件进行区域分割,获得对应区域的初始数据;3)对所述对应区域的初始数据进行OCR扫描,获取对应区域的待检测元数据;4)利用文本匹配算法对待检测元数据进行处理,提取出关键词和关键句,并生成摘要;5)利用文本相似度算法对关键词和关键句进行文本相似度对比,计算关联区域元数据的相似度,并生成关联区域元数据相似度报表。6)判断关联区域元数据相似度报表是否存在异常,若是,则评价结果为不合理,否则,评价结果为合理。所述异常的判断标准为:对相似度报表内关联区域的相似度进行加权,若加权后的相似度低于阈值,则存在异常,若加权后的相似度不低于阈值,则不存在异常。2.根据权利要求1所述的一种基于语义分析的课程目标达成情况评价合理性评价的方法,其特征在于,所述读取课程目标达成情况文档后,对课程目标达成情况文档进行格式归一化处理。3.根据权利要求1所述的一种基于语义分析的课程目标达成情况评价合理性评价的方法,其特征在于,在步骤3)中,获取对应区域的待检测元数据后,对其进行预设标准向量化;所述预设标准向量化的步骤包括:3.1)将待检测元数据进行向量化处理;3.2)将向量化的元数据根据文本匹配算法模型的输入做标准化。4.根据权利要求1所述的一种基于语义分析的课程目标达成情况评价合理性评价的方法,其特征在于,在步骤4)中,利用文本匹配算法对待检测元数据进行处理,提取出关键词和关键句,并生成摘要的步骤包括:4.1)根据历史课程目标达成情况评价文档的元数据向量,构建文本匹配算法模型;所述文本匹配算法模型包括关键词抽取模型和关键句抽取模型;4.2)将待检测元数据输入到关键词抽取模型中,抽取得到关键词;4.3)将待检测元数据输入到关键句抽取模型中,抽取得到关键句。5.根据权利要求4所述的一种基于语义分析的课程目标达成情况评价合理性评价的方法,其特征在于,所述关键词抽取模型如下所示:式中,为关键词,i1=1,2,

,n,n为关键词数量;为关键词对文本的重要度;a为学习率;为关键词跳转到文本页面,在有向有权图的图中对应入度的点;为关键词跳转到文本页面,在有向有权图的图中对应出度的点。6.根据权利要求4所述的一...

【专利技术属性】
技术研发人员:胡钦瑜叶芸郭欣刘富龙
申请(专利权)人:鹰谷睿科重庆数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1