知识图谱构建方法及系统技术方案

技术编号:25637250 阅读:104 留言:0更新日期:2020-09-15 21:29
本发明专利技术提供了知识图谱构建方法及系统,该知识图谱构建方法及系统通过对经过批改的学生所做的作业或者试卷进行拍照,并对拍照得到的拍照进行识别以获得被评判为错误的目标题目的题目内容和解答结果,再分析获得该题目内容包含的知识点和开始出错的解答步骤,从而最终构建相应的知识图谱;可见,该方法及系统应用智能化技术(例如MCM等技术)对相应的作业数据和试卷数据进行知识点和解答步骤的横向和纵向挖掘,以此提高关于预设对象的知识图谱构建可靠性和精确性。

【技术实现步骤摘要】
知识图谱构建方法及系统
本专利技术涉及人工智能教育的
,特别涉及知识图谱构建方法及系统。
技术介绍
在教学过程中,学生的知识图谱能够准确地反映学生的知识掌握水平和知识掌握程度,并且还能够根据不同学生的知识图谱对其制定出有针对性地教学方案。目前,对于知识图谱的构建都只是对学生的作业数据和考试数据进行简单的分析汇总,其并不能对这些作业数据和考试数据进行智能化和纵向与横向深度化的智能挖掘分析,这严重地降低了知识图谱的可靠性和准确性。
技术实现思路
针对现有技术存在的缺陷,本专利技术提供知识图谱构建方法及系统,该知识图谱构建方法及系统通过对经过批改的学生所做的作业或者试卷进行拍照,并对拍照得到的拍照进行识别以获得被评判为错误的目标题目的题目内容和解答结果,再分析获得该题目内容包含的知识点和开始出错的解答步骤,从而最终构建相应的知识图谱;可见,该方法及系统应用智能化技术(例如MCM蒙特卡洛统计模拟等技术)对相应的作业数据和试卷数据进行知识点和解答步骤的横向和纵向挖掘,以此提高关于预设对象的知识图谱构建可靠性和精确性。本专利技术提供知识图谱构建方法,其特征在于,所述知识图谱构建方法包括如下步骤:步骤S1,对预设对象进行拍照,以此获得预设对象照片,其中,所述预设对象包括被老师批改过的学生所做的作业或者试卷;步骤S2,对所述预设对象照片进行识别,以此获得所述预设对象所包含的预设内容,其中,所述预设内容包括每一道题目的题目内容和每一道题目的解答结果所对应的对错评判符号;步骤S3,从所述预设内容中获得所述解答结果被评判为错误的目标题目的题目内容和解答结果;步骤S4,对所述目标题目的题目内容进行分析,以此获得所述目标题目中包含的知识点;对所述目标题目的解答结果进行分析,以此获得所述目标题目的解答结果中开始出错的解答步骤;步骤S5,根据所述目标题目中包含的知识点和所述目标题目的解答结果中开始出错的解答步骤,确定所述预设对象的知识图谱;进一步,在所述步骤S1中,对预设对象进行拍照,以此获得预设对象照片具体包括,步骤S101,对所述预设对象进行第一次拍照,以此获得第一预设对象照片,并分析计算所述第一预设对象照片中关于所述预设对象的拍照覆盖完整度和字符清晰度;步骤S102,判断所述拍摄覆盖完整度是否超过预设拍摄覆盖比例阈值以及所述字符清晰度是否超过预设分辨率阈值,若是,则将所述第一预设对象照片作为所述步骤S2进行识别的目标照片,若否,则重新对所述预设对象进行拍照,直到重新获得的预设对象照片的拍摄覆盖完整度和字符清晰度分别超过所述预设拍摄覆盖比例阈值和所述预设分辨率阈值为止;进一步,在所述步骤S2中,对所述预设对象照片进行识别,以此获得所述预设对象所包含的预设内容具体包括,步骤S201,对所述预设对象照片进行关于字符撰写格式与否的第一识别处理,并将所述预设对象照片中具有标准化字符撰写格式的部分识别为所述题目内容、以及将所述预设对象照片中具有手写化字符撰写格式的部分识别为所述解答结果;步骤S202,对所述预设对象照片中所有解答结果进行关于对错评判符号的第二识别处理,以此确定每一解答结果各自对应的对错评判状态;进一步,在所述步骤S4中,对所述目标题目的题目内容进行分析,以此获得所述目标题目中包含的知识点具体包括,以所述目标题目的题目内容为锚点抽取所述目标题目的题目内容中的单词和词组,再利用下面公式(1)将抽取到的单词和词组进行代入运算,以此得到题目内容语义分析值,然后利用所述题目内容语义分析值匹配找到与所述目标题目的题目内容上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将所述新的词组作为所述知识点;在上述公式(1)中,ni,j表示抽取到的所述目标题目的题目内容的第i个单词和词组与未抽取到的所述目标题目的题目内容的第j个单词和词组对应的目标内容语义分析值,Xi表示抽取到的所述目标题目的题目内容的第i个单词和词组对应的词向量,Bj表示未抽取到的所述目标题目的题目内容的第j个单词和词组的词向量,w表示所述目标题目的题目内容的单词和词组的总个数,v表示抽取到的所述目标题目的题目内容的单词和词组的总个数;当ni,j>0.8时,表示抽取到的所述目标题目的题目内容的第i个单词和词组与未抽取到的所述目标题目的题目内容的第j个单词和词组之间是上下文关联的,同时将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,以作为所述知识点;或者,在所述步骤S4中,对所述目标题目的解答结果进行分析,以此获得所述目标题目的解答结果中开始出错的解答步骤具体包括,根据预设目标题目的标准解答结果并利用下面公式(2),对所述目标题目的解答结果进行相似度匹配计算,并根据所述相似度匹配计算的结果确定所述目标题目的解答结果中开始出错的解答步骤,在上述公式(2)中,Hk表示所述目标题目的解答结果中第k个解答步骤的出错判定值,Dkz表示所述目标题目的解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,Ekz表示所述预设目标题目的标准解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,r表示解答步骤向量中分量的总个数,η表示相似度匹配成功判定值,其中η的取值为0.95,u()表示一阶跃函数,所述阶跃函数在括号内的值大于或者等于0时,函数取值为1,当括号内的值小于0时,函数取值为0;自k从1开始依次取值,当出现Hk>0时停止计算,则将当前Hk的作为所述目标题目的解答结果中开始出错的解答步骤向量,并将所述解答步骤向量对应的解答步骤作为所述目标题目的解答结果中开始出错的解答步骤;进一步,在所述步骤S5中,根据所述目标题目中包含的知识点和所述目标题目的解答结果中开始出错的解答步骤,确定所述预设对象的知识图谱具体包括,以所述目标题目的解答结果中开始出错的解答步骤为锚点抽取所述目标题目的解答结果中开始出错的解答步骤的单词和词组,再利用下面公式(3)将抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组进行代入运算,以此得到出错解答步骤语义分析值,然后利用所述出错解答步骤语义分析值匹配找到与所述目标题目的解答结果中开始出错的解答步骤的单词和词组上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将所述新的词组作为标准错误解答步骤实体;在上述公式(3)中,mt,g表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组与未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组对应的出错解答步骤语义分析值,Ct表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组对应的词向量,Qg表示未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组的词向量,f表示所述目标题目的解答结果中开始出错的解答步骤的单词和词组的总个数,a表示抽取到的所述目本文档来自技高网...

【技术保护点】
1.知识图谱构建方法,其特征在于,所述知识图谱构建方法包括如下步骤:/n步骤S1,对预设对象进行拍照,以此获得预设对象照片,其中,所述预设对象包括被老师批改过的学生所做的作业或者试卷;/n步骤S2,对所述预设对象照片进行识别,以此获得所述预设对象所包含的预设内容,其中,所述预设内容包括每一道题目的题目内容和每一道题目的解答结果所对应的对错评判符号;/n步骤S3,从所述预设内容中获得所述解答结果被评判为错误的目标题目的题目内容和解答结果;/n步骤S4,对所述目标题目的题目内容进行分析,以此获得所述目标题目中包含的知识点;对所述目标题目的解答结果进行分析,以此获得所述目标题目的解答结果中开始出错的解答步骤;/n步骤S5,根据所述目标题目中包含的知识点和所述目标题目的解答结果中开始出错的解答步骤,确定所述预设对象的知识图谱。/n

【技术特征摘要】
1.知识图谱构建方法,其特征在于,所述知识图谱构建方法包括如下步骤:
步骤S1,对预设对象进行拍照,以此获得预设对象照片,其中,所述预设对象包括被老师批改过的学生所做的作业或者试卷;
步骤S2,对所述预设对象照片进行识别,以此获得所述预设对象所包含的预设内容,其中,所述预设内容包括每一道题目的题目内容和每一道题目的解答结果所对应的对错评判符号;
步骤S3,从所述预设内容中获得所述解答结果被评判为错误的目标题目的题目内容和解答结果;
步骤S4,对所述目标题目的题目内容进行分析,以此获得所述目标题目中包含的知识点;对所述目标题目的解答结果进行分析,以此获得所述目标题目的解答结果中开始出错的解答步骤;
步骤S5,根据所述目标题目中包含的知识点和所述目标题目的解答结果中开始出错的解答步骤,确定所述预设对象的知识图谱。


2.如权利要求1所述的知识图谱构建方法,其特征在于:
在所述步骤S1中,对预设对象进行拍照,以此获得预设对象照片具体包括,
步骤S101,对所述预设对象进行第一次拍照,以此获得第一预设对象照片,并分析计算所述第一预设对象照片中关于所述预设对象的拍照覆盖完整度和字符清晰度;
步骤S102,判断所述拍摄覆盖完整度是否超过预设拍摄覆盖比例阈值以及所述字符清晰度是否超过预设分辨率阈值,若是,则将所述第一预设对象照片作为所述步骤S2进行识别的目标照片,若否,则重新对所述预设对象进行拍照,直到重新获得的预设对象照片的拍摄覆盖完整度和字符清晰度分别超过所述预设拍摄覆盖比例阈值和所述预设分辨率阈值为止。


3.如权利要求1所述的知识图谱构建方法,其特征在于:
在所述步骤S2中,对所述预设对象照片进行识别,以此获得所述预设对象所包含的预设内容具体包括,
步骤S201,对所述预设对象照片进行关于字符撰写格式与否的第一识别处理,并将所述预设对象照片中具有标准化字符撰写格式的部分识别为所述题目内容、以及将所述预设对象照片中具有手写化字符撰写格式的部分识别为所述解答结果;
步骤S202,对所述预设对象照片中所有解答结果进行关于对错评判符号的第二识别处理,以此确定每一解答结果各自对应的对错评判状态。


4.如权利要求1所述的知识图谱构建方法,其特征在于:
在所述步骤S4中,对所述目标题目的题目内容进行分析,以此获得所述目标题目中包含的知识点具体包括,
以所述目标题目的题目内容为锚点抽取所述目标题目的题目内容中的单词和词组,再利用下面公式(1)将抽取到的单词和词组进行代入运算,以此得到题目内容语义分析值,然后利用所述题目内容语义分析值匹配找到与所述目标题目的题目内容上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将所述新的词组作为所述知识点;



在上述公式(1)中,ni,j表示抽取到的所述目标题目的题目内容的第i个单词和词组与未抽取到的所述目标题目的题目内容的第j个单词和词组对应的目标内容语义分析值,Xi表示抽取到的所述目标题目的题目内容的第i个单词和词组对应的词向量,Bj表示未抽取到的所述目标题目的题目内容的第j个单词和词组的词向量,w表示所述目标题目的题目内容的单词和词组的总个数,v表示抽取到的所述目标题目的题目内容的单词和词组的总个数;
当ni,j>0.8时,表示抽取到的所述目标题目的题目内容的第i个单词和词组与未抽取到的所述目标题目的题目内容的第j个单词和词组之间是上下文关联的,同时将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,以作为所述知识点;
或者,
在所述步骤S4中,对所述目标题目的解答结果进行分析,以此获得所述目标题目的解答结果中开始出错的解答步骤具体包括,
根据预设目标题目的标准解答结果并利用下面公式(2),对所述目标题目的解答结果进行相似度匹配计算,并根据所述相似度匹配计算的结果确定所述目标题目的解答结果中开始出错的解答步骤,



在上述公式(2)中,Hk表示所述目标题目的解答结果中第k个解答步骤的出错判定值,Dkz表示所述目标题目的解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,Ekz表示所述预设目标题目的标准解答结果中第k个解答步骤对应的解答步骤向量的第z个分量,r表示解答步骤向量中分量的总个数,η表示相似度匹配成功判定值,其中η的取值为0.95,u()表示一阶跃函数,所述阶跃函数在括号内的值大于或者等于0时,函数取值为1,当括号内的值小于0时,函数取值为0;自k从1开始依次取值,当出现Hk>0时停止计算,则将当前Hk的作为所述目标题目的解答结果中开始出错的解答步骤向量,并将所述解答步骤向量对应的解答步骤作为所述目标题目的解答结果中开始出错的解答步骤。


5.如权利要求1所述的知识图谱构建方法,其特征在于:
在所述步骤S5中,根据所述目标题目中包含的知识点和所述目标题目的解答结果中开始出错的解答步骤,确定所述预设对象的知识图谱具体包括,
以所述目标题目的解答结果中开始出错的解答步骤为锚点抽取所述目标题目的解答结果中开始出错的解答步骤的单词和词组,再利用下面公式(3)将抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组进行代入运算,以此得到出错解答步骤语义分析值,然后利用所述出错解答步骤语义分析值匹配找到与所述目标题目的解答结果中开始出错的解答步骤的单词和词组上下文关联且并未抽取到的单词和词组,最后将抽取到的单词和词组与未抽取到的单词和词组共同组成新的词组,并将所述新的词组作为标准错误解答步骤实体;



在上述公式(3)中,mt,g表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组与未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组对应的出错解答步骤语义分析值,Ct表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组对应的词向量,Qg表示未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组的词向量,f表示所述目标题目的解答结果中开始出错的解答步骤的单词和词组的总个数,a表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组的总个数;
当mt,g>0.8时,表示抽取到的所述目标题目的解答结果中开始出错的解答步骤的第t个单词和词组与未抽取到的所述目标题目的解答结果中开始出错的解答步骤的第g个单词和词组之间是上下文关联的,同时将所有与所述目标题目的解答结果中开始出错的解答步骤的单词和词组上下文关联且并未抽取到的所述目标题目的解答结果中开始出错的解答步骤的单词和词组组成新的词组,以作为所述标准错误解答步骤实体;
最后,将每一道题目对应的知识点与标准错误解答步骤实体相互构建成映射对,再将得到的所有映射对进行组合,从而确定所述预设对象的知识图谱,其中,所述知识图谱包括特定题目与特定错误解答步骤之间的知识对应关系。


6.知识图谱构建系统,其特征在于:
所述知识图谱构建系统包括拍照模块...

【专利技术属性】
技术研发人员:栗浩洋
申请(专利权)人:上海乂学教育科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1