智能化教育知识图谱构建系统与方法技术方案

技术编号:25439351 阅读:37 留言:0更新日期:2020-08-28 22:27
本发明专利技术提供了智能化教育知识图谱构建系统与方法,该智能化教育知识图谱构建系统与方法不仅能够对教育知识点数据本身进行有针对性的文本转换和纠错规范,以此提高该教育知识点数据的准确性和可靠性,并且还能够以文本元的形式对不同教育知识点数据之间的实体关联性进行有效地挖掘,以使构建得到的教育知识图谱更能够真实地和全面地反映不同教育知识点数据在知识层面上的关系,从而提高教育知识图谱的数据可溯性和数据可靠性。

【技术实现步骤摘要】
智能化教育知识图谱构建系统与方法
本专利技术涉及智能教学的
,特别涉及智能化教育知识图谱构建系统与方法。
技术介绍
智能化教育技术已经广泛应用于不同模式的知识教授和课程学习中,智能化教育能够帮助老师或者学生实现有针对性的和精准的教育知识数据加工以及高效的知识教授与学习。但是,在知识教育领域,相关的知识教育数据的数据量是巨大的并且数据结构较为复杂,为了提高教育知识学习的全面性,需要对教育知识数据进行准确的挖掘与关联,以此构建相应的教育知识图谱。但是,现有技术构建教育知识图谱的方式都只是局限于教育知识数据本身的文本属性,其并未针对不同教育知识数据之间的关联性进行构建,这不利于提高教育知识图谱的数据可溯性和数据可靠性。
技术实现思路
针对现有技术存在的缺陷,本专利技术提供智能化教育知识图谱构建系统与方法,该智能化教育知识图谱构建系统与方法通过对关于某一学科的教育知识点数据进行关于知识点内容的分类后,进行可识别文本转换处理和规范化处理,以此生成知识文本集合,并且还确定该知识点文本集合中不同文本元之间的实体关联性,最后再根据该实体关联性,对该知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱;可见,该智能化教育知识图谱构建系统与方法不仅能够对教育知识点数据本身进行有针对性的文本转换和纠错规范,以此提高该教育知识点数据的准确性和可靠性,并且还能够以文本元的形式对不同教育知识点数据之间的实体关联性进行有效地挖掘,以使构建得到的教育知识图谱更能够真实地和全面地反映不同教育知识点数据在知识层面上的关系,从而提高教育知识图谱的数据可溯性和数据可靠性。本专利技术提供智能化教育知识图谱构建系统,其特征在于:所述智能化教育知识图谱构建系统包括教育知识点数据分类模块、知识文本集合生成模块、文本元实体关联系确定模块和教育知识图谱构建模块;其中,所述教育知识点数据分类模块用于对来自预设教育资源库的某一学科的教育知识点数据进行关于知识点内容的分类;所述知识文本集合生成模块用于对所述分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合;所述文本元实体关联系确定模块用于确定所述知识点文本集合中不同文本元之间的实体关联性;所述教育知识图谱构建模块用于根据所述实体关联性,对所述知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱;进一步,所述教育知识点数据分类模块包括教育知识点数据获取子模块、知识难度值计算子模块和分类确定子模块;其中,所述教育知识点数据获取子模块用于根据关于所述某一学科的教学课程框架,从所述预设教育资源库中获取关于所述某一学科的所述教育知识点数据;所述知识难度值计算子模块用于通过预设学科知识神经网络模型,计算每一项所述教育知识点数据对应的知识内容难度值;所述分类确定子模块用于根据所述知识内容难度值,将所有项教育知识点数据分类为具有不同难度等级的教育知识点数据;进一步,所述知识文本集合生成模块包括可识别文本转换处理子模块、规范化处理子模块和知识文本集合组成子模块;其中,所述可识别文本转换处理子模块用于对所述分类后的教育知识点数据进行关于分词和/或短句的可识别文本转换处理,以此获得初始化知识文本;所述规范化处理子模块用于对所述初始化知识文本进行语法规范化、逻辑规范化和错别字规范化中的至少一者处理,以此将所述初始化知识文本转换为规范化知识文本;所述知识文本集合组成子模块用于根据所述分类后的不同教育知识点数据各自的难度等级,将所有规范化文本组成具有多维矩阵形式的知识文本集合;进一步,所述文本元实体关联系确定模块包括文本元生成子模块和实体关联性评价值计算子模块;其中,所述文本元生成子模块用于根据所述知识点文本集合中的每一项知识点文本的文本语料和文本结构,将每一项知识点文本转换为相应的文本元;所述实体关联性评价值计算子模块用于通过知识点文本实体关联性评价神经网络模型对所有文本元进行分析处理,以此计算不同文本元相互之间在文本实体语料和/或文本实体结构上的实体关联性评价值;进一步,所述教育知识图谱构建模块包括重组排列子模块、索引标注子模块和图谱转化处理子模块;其中,所述重组排列子模块用于根据所述实体关联性对应的实体关联性评价值,对所述知识点文本集合中的所有文本元进行关于评价值高低的重组排列,以此生成具有不同高低实体关联性表征状态的文本元结构树;所述索引标注子模块用于对所述文本元结构树上的每一个文本元进行关于文本语义和/或文本查询路径的索引标注,以此获得索引标注化文本元结构树;所述图谱转化处理子模块用于将所述索引标注化文本元结构树进行二维图谱的转化处理,以此构建形成关于所述某一学科的教育知识图谱;进一步,所述文本元实体关联系确定模块用于确定所述知识点文本集合中不同文本元之间的实体关联性,其具体实现过程如下:步骤A1,根据所述教育知识点数据获取子模块获取所述某一学科的所述教育知识点数据,通过预设学科知识神经网络模型以及下面公式(1),获取每一项所述教育知识点数据对应的知识内容难度值在上述公式(1)中,P为所述各学科所含教育知识点数据的数量,p=1,2,3、、、P;k为所述知识点数据难度等级,其取值范围为[0,22],dk为所述知识点数据难度等级为k所对应知识点数据复杂语法结构数量,ok为所述知识点数据难度等级为k所对应知识点数据复杂文本结构数量,为各项所述教育知识点数据中既有复杂语法结构及复杂文本结构的语句数量,j为知识点数据在考核中分数占比,wj为知识点数据在考核中分数占比为j所对应的重要知识点排序,f(ok,d)为根据各知识点数据的复杂语法结构和文本结构数量判断知识点的难易度,其判断阈值为0.6,即当知识点数据的复杂语法结构和文本结构数量超过总知识的0.6时,判断为较难知识点,反之,则为较易知识点,f(wj,k)为根据知识点数据在考核中分数占比判断是否为重要知识点,其判断阈值为0.3,即考核中该知识点数据分数占比超过总分数的0.3,则判断为重要知识点,P(wj,dk,ok)为获取每一项所述教育知识点数据对应的知识内容难度值;步骤A2,根据步骤A1获取的每一项所述教育知识点数据对应的知识内容难度值以及下面公式(2),进行数据关联组合,获取多维矩阵形式的知识文本集合在上述公式(2)中,Π为连乘,M为所述待组成具有多维矩阵形式的知识文本子集数量,i为所述各项教育知识点数据中所含单词数量,ai为所述各项教育知识点数据中所含单词数量为i所对应的词组/短句总数,l为根据首字母进行组合的子集数量,bl为根据首字母进行组合的子集数量为l所对应各子集索引标注信息,为所述知识文本重组排列的次数,γ为将各文本词组按照首字母、次字母顺序进行多维矩阵排序,F(ai,bl)为获取多维矩阵形式的知识文本集合;步骤A3,将步骤A2获取的多维矩阵形式的知识文本集合,本文档来自技高网...

【技术保护点】
1.智能化教育知识图谱构建系统,其特征在于:/n所述智能化教育知识图谱构建系统包括教育知识点数据分类模块、知识文本集合生成模块、文本元实体关联系确定模块和教育知识图谱构建模块;其中,/n所述教育知识点数据分类模块用于对来自预设教育资源库的某一学科的教育知识点数据进行关于知识点内容的分类;/n所述知识文本集合生成模块用于对所述分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合;/n所述文本元实体关联系确定模块用于确定所述知识点文本集合中不同文本元之间的实体关联性;/n所述教育知识图谱构建模块用于根据所述实体关联性,对所述知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱。/n

【技术特征摘要】
1.智能化教育知识图谱构建系统,其特征在于:
所述智能化教育知识图谱构建系统包括教育知识点数据分类模块、知识文本集合生成模块、文本元实体关联系确定模块和教育知识图谱构建模块;其中,
所述教育知识点数据分类模块用于对来自预设教育资源库的某一学科的教育知识点数据进行关于知识点内容的分类;
所述知识文本集合生成模块用于对所述分类后的不同教育知识点数据进行可识别文本转换处理和规范化处理,以此生成知识文本集合;
所述文本元实体关联系确定模块用于确定所述知识点文本集合中不同文本元之间的实体关联性;
所述教育知识图谱构建模块用于根据所述实体关联性,对所述知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱。


2.如权利要求1所述的智能化教育知识图谱构建系统,其特征在于:
所述教育知识点数据分类模块包括教育知识点数据获取子模块、知识难度值计算子模块和分类确定子模块;其中,
所述教育知识点数据获取子模块用于根据关于所述某一学科的教学课程框架,从所述预设教育资源库中获取关于所述某一学科的所述教育知识点数据;
所述知识难度值计算子模块用于通过预设学科知识神经网络模型,计算每一项所述教育知识点数据对应的知识内容难度值;
所述分类确定子模块用于根据所述知识内容难度值,将所有项教育知识点数据分类为具有不同难度等级的教育知识点数据。


3.如权利要求1所述的智能化教育知识图谱构建系统,其特征在于:
所述知识文本集合生成模块包括可识别文本转换处理子模块、规范化处理子模块和知识文本集合组成子模块;其中,
所述可识别文本转换处理子模块用于对所述分类后的教育知识点数据进行关于分词和/或短句的可识别文本转换处理,以此获得初始化知识文本;
所述规范化处理子模块用于对所述初始化知识文本进行语法规范化、逻辑规范化和错别字规范化中的至少一者处理,以此将所述初始化知识文本转换为规范化知识文本;
所述知识文本集合组成子模块用于根据所述分类后的不同教育知识点数据各自的难度等级,将所有规范化文本组成具有多维矩阵形式的知识文本集合。


4.如权利要求1所述的智能化教育知识图谱构建系统,其特征在于:
所述文本元实体关联系确定模块包括文本元生成子模块和实体关联性评价值计算子模块;其中,
所述文本元生成子模块用于根据所述知识点文本集合中的每一项知识点文本的文本语料和文本结构,将每一项知识点文本转换为相应的文本元;
所述实体关联性评价值计算子模块用于通过知识点文本实体关联性评价神经网络模型对所有文本元进行分析处理,以此计算不同文本元相互之间在文本实体语料和/或文本实体结构上的实体关联性评价值。


5.如权利要求1所述的智能化教育知识图谱构建系统,其特征在于:
所述教育知识图谱构建模块包括重组排列子模块、索引标注子模块和图谱转化处理子模块;其中,
所述重组排列子模块用于根据所述实体关联性对应的实体关联性评价值,对所述知识点文本集合中的所有文本元进行关于评价值高低的重组排列,以此生成具有不同高低实体关联性表征状态的文本元结构树;
所述索引标注子模块用于对所述文本元结构树上的每一个文本元进行关于文本语义和/或文本查询路径的索引标注,以此获得索引标注化文本元结构树;
所述图谱转化处理子模块用于将所述索引标注化文本元结构树进行二维图谱的转化处理,以此构建形成关于所述某一学科的教育知识图谱。


6.如权利要求1所述的智能化教育知识图谱构建系统,其特征在于:
所述文本元实体关联系确定模块用于确定所述知识点文本集合中不同文本元之间的实体关联性,其具体实现过程如下:
步骤A1,根据所述教育知识点数据获取子模块获取所述某一学科的所述教育知识点数据,通过预设学科知识神经网络模型以及下面公式(1),获取每一项所述教育知识点数据对应的知识内容难度值



在上述公式(1)中,P为所述各学科所含教育知识点数据的数量,p=1,2,3、、、P;k为所述知识点数据难度等级,其取值范围为[0,22],dk为所述知识点数据难度等级为k所对应知识点数据复杂语法结构数量,ok为所述知识点数据难度等级为k所对应知识点数据复杂文本结构数量,为各项所述教育知识点数据中既有复杂语法结构及复杂文本结构的语句数量,j为知识点数据在考核中分数占比,wj为知识点数据在考核中分数占比为j所对应的重要知识点排序,f(ok,d)为根据各知识点数据的复杂语法结构和文本结构数量判断知识点的难易度,其判断阈值为0.6,即当知识点数据的复杂语法结构和文本结构数量超过总知识的0.6时,判断为较难知识点,反之,则为较易知识点,f(wj,k)为根据知识点数据在考核中分数占比判断是否为重要知识点,其判断阈值为0.3,即考核中该知识点数据分数占比超过总分数的0.3,则判断为重要知识点,P(wj,dk,ok)为获取每一项所述教育知识点数据对应的知识内容难度值;
步骤A2,根据步骤...

【专利技术属性】
技术研发人员:崔炜
申请(专利权)人:上海乂学教育科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1