一种基于知识图谱的学习方法技术

技术编号:37818205 阅读:10 留言:0更新日期:2023-06-09 09:49
本发明专利技术涉及学习方法领域,尤其涉及一种基于知识图谱的学习方法,包括:获取用户的行为数据信息并提取特征词库,根据特征词库与各学科知识图谱的重合度选择三个目标学科,根据与所述目标学科的关联度大小,设置对应的附属学科集,根据所述目标学科和对应的所述附属学科集构建专属于用户的知识图谱,根据用户群体反馈的正确率大小划分所述附属学科的学习深度等级并调整学习深度,根据用户在所述附属学科的学习时长判断用户兴趣度,根据所述用户兴趣度和所述学习深度判断是否需要提高学习广度并重新构建专属于用户的知识图谱。本发明专利技术通过智能调节用户学习深度和广度,适应性地匹配用户的学习需求,提高用户的学习效率。提高用户的学习效率。提高用户的学习效率。

【技术实现步骤摘要】
一种基于知识图谱的学习方法


[0001]本专利技术涉及学习方法领域,尤其涉及一种基于知识图谱的学习方法。

技术介绍

[0002]知识图谱在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,用以挖掘、分析、构建、绘制和显示知识及它们之间的相互联系,通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域和整体知识架构达到多学科融合目的的现代理论,为学科研究提供有价值的参考。
[0003]公开号CN110866848A的专利文献公开了一种基于知识图谱的学习方法、装置、电子设备和存储介质,该专利技术基于知识图谱的学习方法及装置通过与用户之间的互动,在知识图谱对应的节点中动态设置权重值匹配用户对应的知识图谱。
[0004]该专利技术仅仅根据知识图谱对应的节点中动态设置权重值匹配用户对应的知识图谱提取特征和作出判断的方法过于单一,不能全面的体现用户特征,所构建的知识图谱不能适应性地匹配用户的学习需求,导致学习的效率不高。

技术实现思路

[0005]为此,本专利技术提供一种基于知识图谱的学习方法,可以解决所构建的知识图谱不能适应性地匹配用户的学习需求,导致学习的效率不高的问题。
[0006]为实现上述目的,本专利技术提供一种基于知识图谱的学习方法,包括:
[0007]获取用户的行为数据信息;<br/>[0008]提取所述行为数据信息中的特征词库;
[0009]根据所述特征词库与各学科知识图谱的重合度选择三个目标学科,将三个目标学科分别设为第一目标学科、第二目标学科和第三目标学科;
[0010]根据待测学科与所述目标学科之间关联度r的大小,将符合r≥r0条件下对应的待测学科设为所述目标学科的一个附属学科,并根据所有附属学科的集合建立所述目标学科对应的附属学科集,其中r0为预设关联度;
[0011]根据得到的所述第一目标学科、所述第二目标学科和所述第三目标学科和对应的所述附属学科集以用户ID为基点构建第一知识图谱,并以用户ID为索引上传至平台数据库;
[0012]根据所述各附属学科集中所述附属学科的数量大小关系调整平台推送对应附属学科集的学习内容占比;
[0013]根据用户群体反馈的正确率大小c0与平台所设第一预设正确率b1和第二预设正确率b2的大小关系将所述附属学科的学习深度划分为三个等级,再根据不同学习深度等级的附属学科用户群体反馈的正确率大小c0与平台获取的所述附属学科用户反馈的实际正
确率c1的大小关系调整用户的学习深度;
[0014]根据用户对所述附属学科的学习时长判断用户兴趣度;
[0015]根据所述用户兴趣度和所述学习深度判断用户是否需要调整学习广度,以及,将需要调整学习广度的用户根据所述第一知识图谱的所述目标学科从所述平台数据库中提取第二知识图谱,其中第二知识图谱为与所述第一知识图谱中所述目标学科的重合度为(N

1)/N的知识图谱,N所述第一知识图谱中的所述目标学科的数量,根据所述第一知识图谱与第二知识图谱的比较关系调整用户学习广度,并重新构建所述第一知识图谱。
[0016]进一步地,获取用户的行为数据信息包括获取用户在平台内输入文字记录、平台内浏览页面包含的文字信息和平台内浏览页面包含的图像信息;
[0017]将用户使用过程中在平台输入的弹幕、评论和学习笔记设为第一文字信息;
[0018]将用户在平台内浏览页面包含的文字信息设为第二文字信息;
[0019]将用户在平台内浏览页面包含的且能够被知识图谱准确提取到的图片信息基于知识图谱在任意一个三元组范围内转化的文字信息设为第三文字信息。
[0020]进一步地,提取所述第一文字信息、所述第二文字信息和所述第三文字信息中的特征词库;
[0021]对所述第一文字信息、所述第二文字信息和所述第三文字信息中词汇根据平台预设的大数据词典进行词性分类,并保留所述第一文字信息、所述第二文字信息和所述第三文字信息中名词词性的单词,并将保留的名词词性的单词设为待提取特征词库;将所述待提取特征词库中的单词按出现频率由大到小排序,提取出现频率最高的十个单词,将提取到出现频率最高的十个单词设为特征词库。
[0022]进一步地,根据所述特征词库与各学科知识图谱的重合系数的大小选择三个目标学科,分别设为第一目标学科、第二目标学科和第三目标学科;
[0023]将各学科为第一端点一个三元组范围内的所有第二端点的集合设为第一集合,将各学科为第一端点两个三元组范围内的所有第二端点的集合设为第二集合,将各学科为第一端点三个三元组范围内的所有第二端点的集合设为第三集合;
[0024]将所述特征词库与所述第一集合重合的单词个数设为a个,将所述特征词库与所述第二集合重合的单词个数设为b个,将所述特征词库与所述第三集合重合的单词个数设为c个,将所述特征词库不与所述第一集合、所述第二集合和所述第三集合重合的单词个数设为d个,其中a+b+c+d=10;
[0025]根据公式3a+2b+1c=X得到所述特征词库与各学科知识图谱的重合系数X,将各学科对应的重合系数X由大到小排序,选择重合系数X最大的三个学科,分别设为第一目标学科、第二目标学科和第三目标学科。
[0026]进一步地,根据待测学科与所述目标学科之间关联度r的大小,建立所述目标学科对应的附属学科集;
[0027]提取以所述目标学科为第一端点的知识图谱中一个三元组范围内的第二端点,将提取到的第二端点集合设为目标端点组;
[0028]将以待测学科为第一端点的知识图谱中一个三元组范围内的第二端点的集合设为待测端点组,并将待测端点组的端点总数设为第一数量a1;
[0029]提取所述目标端点组和所述待测端点组的重合端点,将重合端点的数量设为第二
数量a2;
[0030]设定关联度r=第二数量a2/第一数量a1,当r≥r0时,将所述待测学科设为所述目标学科的一个附属学科;
[0031]将所述第一目标学科的对应的附属学科集合设为第一附属学科集,将所述第二目标学科的对应的附属学科集合设为第二附属学科集,将所述第三目标学科的对应的附属学科集合设为第三附属学科集。
[0032]进一步地,根据得到的所述第一目标学科、所述第二目标学科和所述第三目标学科和对应的所述附属学科集以用户ID为基点构建第一知识图谱,并以用户ID为索引上传至平台数据库;
[0033]将所述第一附属学科集中附属学科的数量设为x,所述第二附属学科集中附属学科的数量设为y,将所述第三附属学科集中附属学科的数量设为z;
[0034]将x/(x+y+z)设为第一附属学科占比,将y/(x+y+z)设为第二附属学科占比,将z/(x+y+z)设为第三附属学科占比;
[0035]将所述第一附属学科占本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的学习方法,其特征在于,包括:获取用户的行为数据信息;提取所述行为数据信息中的特征词库;根据所述特征词库与各学科知识图谱的重合度选择三个目标学科,将三个目标学科分别设为第一目标学科、第二目标学科和第三目标学科;根据待测学科与所述目标学科之间关联度r的大小,将符合r≥r0条件下对应的待测学科设为所述目标学科的一个附属学科,并根据所有附属学科的集合建立所述目标学科对应的附属学科集,其中r0为预设关联度;根据得到的所述第一目标学科、所述第二目标学科和所述第三目标学科和对应的所述附属学科集以用户ID为基点构建第一知识图谱,并以用户ID为索引上传至平台数据库;根据所述各附属学科集中所述附属学科的数量大小关系调整平台推送对应附属学科集的学习内容占比;根据用户群体反馈的正确率大小c0与平台所设第一预设正确率b1和第二预设正确率b2的大小关系将所述附属学科的学习深度划分为三个等级,再根据不同学习深度等级的附属学科用户群体反馈的正确率大小c0与平台获取的所述附属学科用户反馈的实际正确率c1的大小关系调整用户的学习深度;根据用户对所述附属学科的学习时长判断用户兴趣度;根据所述用户兴趣度和所述学习深度判断用户是否需要调整学习广度,以及,将需要调整学习广度的用户根据所述第一知识图谱的所述目标学科从所述平台数据库中提取第二知识图谱,其中第二知识图谱为与所述第一知识图谱中所述目标学科的重合度为(N

1)/N的知识图谱,N所述第一知识图谱中的所述目标学科的数量,根据所述第一知识图谱与第二知识图谱的比较关系调整用户学习广度,并重新构建所述第一知识图谱。2.根据权利要求1所述的基于知识图谱的学习方法,其特征在于,获取用户的行为数据信息包括获取用户在平台内输入文字记录、平台内浏览页面包含的文字信息和平台内浏览页面包含的图像信息;将用户使用过程中在平台输入的弹幕、评论和学习笔记设为第一文字信息;将用户在平台内浏览页面包含的文字信息设为第二文字信息;将用户在平台内浏览页面包含的且能够被知识图谱准确提取到的图片信息基于知识图谱在任意一个三元组范围内转化的文字信息设为第三文字信息。3.根据权利要求2所述的基于知识图谱的学习方法,其特征在于,提取所述第一文字信息、所述第二文字信息和所述第三文字信息中的特征词库;对所述第一文字信息、所述第二文字信息和所述第三文字信息中词汇根据平台预设的大数据词典进行词性分类,并保留所述第一文字信息、所述第二文字信息和所述第三文字信息中名词词性的单词,并将保留的名词词性的单词设为待提取特征词库;将所述待提取特征词库中的单词按出现频率由大到小排序,提取出现频率最高的十个单词,将提取到出现频率最高的十个单词设为特征词库。4.根据权利要求3所述的基于知识图谱的学习方法,其特征在于,根据所述特征词库与各学科知识图谱的重合系数的大小选择三个目标学科,将三个目标学科分别设为第一目标学科、第二目标学科和第三目标学科;
将各学科为第一端点一个三元组范围内的所有第二端点的集合设为第一集合,将各学科为第一端点两个三元组范围内的所有第二端点的集合设为第二集合,将各学科为第一端点三个三元组范围内的所有第二端点的集合设为第三集合;将所述特征词库与所述第一集合重合的单词个数设为a个,将所述特征词库与所述第二集合重合的单词个数设为b个,将所述特征词库与所述第三集合重合的单词个数设为c个,将所述特征词库不与所述第一集合、所述第二集合和所述第三集合重合的单词个数设为d个,其中a+b+c+d=10;根据公式3a+2b+1c=X得到所述特征词库与各学科知识图谱的重合系数X,将各学科对应的重合系数X由大到小排序,选择重合系数X最大的三个学科,分别设为第一目标学科、第二目标学科和第三目标学科。5.根据权利要求4所述的基于知识图谱的学习方法,其特征在于,根据待测学科与所述目标学科之间关联度r的大小,建立所述目标学科对应的附属学科集;提取以所述目标学科为第一端点的知识图谱中一个三元组范围内的第二端点,将提取到的第二端点集合设为目标端点组;将以待测学科为第一端点的知识图谱中一个三元组范围内的第二端点的集合设为待测端点组,并将待测端点组的端点总数设为第一数量a1;提取所述目标端点组和所述待测端点组的重合端点,将重合端点的数量设为第二数量a2;设定关联度r=第二数量a2/第一数量a1,当r≥r0时,将所述待测学科设为所述目标学科的一个附属学科;将所述第一目标学科的对应的附属学科集合设为第一附属学科集,将所述第二目标学科的对应的附属学科集合设为第二附属学科集,将所述第三目标学科的对应的附属学科集合设为第三附属学科集。6.根据权利要求5所述的基于知识图谱的学习方法,其特征在于,根据得到的所述第一目标学科、所述第二目标学科和所述第三目标学科和对应的所述附属学科集以用户ID为基点构建第一知识图谱,并以用户ID为索引上传至平台数据库;将所述第一附属学科集中附属学科的数量设为x,所述第二附属学科集中附属学科的数量设为y,将所述第三附属学科集中附属学科的数量设为z;将x/(x+y+z)设为第一附属学科占比,将y/(x+y+z)设为第二附属学科占比,将z/(x+y+z)设为第三附属学科占比;将所述第一附属学科占比x/(x+y+z)、所述第二附属学科占比y/(x+y+z)和所述第三附属学科占比z/(x+y+z)的数值由大到小排列将对应的各目标学科分别设为第一学习内容、第二学习内容和第三学习内容;分别将第一学习内容、第二学习内容和第三学习内容作为基点,各学习内容对应的附属学科为分支构建三个知识图谱,再以用...

【专利技术属性】
技术研发人员:关颖贤娄渊胜
申请(专利权)人:读书郎教育科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1