当前位置: 首页 > 专利查询>中原工学院专利>正文

基于大数据的数学知识图谱构建方法技术

技术编号:36041865 阅读:23 留言:0更新日期:2022-12-21 10:48
本发明专利技术提供了一种基于大数据的数学知识图谱构建方法,包括:获取待处理的数学知识样本,利用预测模型进行标注,得到至少一个标注结果;将标注结果进行分析,并提取至少一个标注特征,基于标注结果、标注特征、数学知识样本构建多维关联网络;将多维关联网络中的标注结果引出与分类器再形成关联,并记录关联关系;设置多个并行设置的知识图谱单元以及一个任务管理器,所述任务管理器被配置成具有多个记忆实体,每一记忆实体用于构建对应的知识图谱单元的学习资源的调用方式,其中,每一记忆实体用于与分类主体形成对应,并导入关联关系,以使得每一记忆实体与多维关联网络建立连接;从而构建出每一记忆实体基于多维关联网络来调用学习资源。调用学习资源。调用学习资源。

【技术实现步骤摘要】
基于大数据的数学知识图谱构建方法


[0001]本专利技术涉及基于人工智能的计算机
,特别是涉及一种基于大数据的数学知识图谱构建方法。

技术介绍

[0002]目前现有的知识图谱的构建技术中,基本上采用的都是自动构建的方式,以此来降低构建的成本和效率:比如公开号为:“CN108694177A”的专利文献公开了一种知识图谱构建方法及系统,其中方法包括:获取待构建知识图谱的至少一个领域的语料信息;对语料信息包括的知识文本内容片段进行分词以及词性标注,获取其中的关键词;将关键词按照预设的规则与领域本体进行匹配,获取知识文本内容片段中的知识元实例、知识元实例的属性以及知识元实例之间的关联关系;领域本体包括:领域主题,领域主题包括的至少一个模型,模型的属性以及模型之间的关联关系;模型包括至少一个知识元实例;根据多个知识文本内容片段中的知识元实例、知识元实例的属性以及知识元实例之间的关联关系构建知识图谱。
[0003]在上述中,虽然可以实现自动构建,但是在进行待构建知识图谱的标注时,要采用标注模型和预测模型,不同学科以及不同语言的知识具有一定的差异,特别在语义的理解上,学科的名词具有一定的特殊性,因此在使用预测模型时,如果采用的现有的预测模型,就会导致标注结果出现错误;还有,目前大部分在进行知识图谱的构建时,没有采用分类归集的方法,因此不利于后期的使用。

技术实现思路

[0004]有鉴于此,本专利技术的主要目的在于提供一种基于大数据的数学知识图谱构建方法。
[0005]本专利技术采用的技术方案如下:
[0006]基于大数据的数学知识图谱构建方法,包括如下步骤:
[0007]获取待处理的数学知识样本,利用预测模型进行标注,得到至少一个标注结果;
[0008]设置一分析器,所述分析器用于将标注结果进行分析,并提取至少一个标注特征,设置标注特征的属性,使得具有相同标注特征的属性也相同;
[0009]设置一关联器,基于标注特征将相同标注特征进行一维关联,形成一维关联网络;将每一标注结果下的所有标注特征进行关联,并基于形成的一维关联网络来构建二维关联网络,将具有相同标注结果的数学知识样本进行关联,并基于形成的二维关联网络来构建多维关联网络;
[0010]设置一分类库,所述分类库由多个分类主体构成,其中,每一分类主体被配置成至少基于一个标注结果来建立一个对应的分类器,以使得在每一分类主体下形成多个并列的分类器;将多维关联网络中的标注结果引出与分类器再形成关联,并记录关联关系;
[0011]构建知识图谱模型:设置多个并行设置的知识图谱单元以及一个任务管理器,所
述任务管理器被配置成具有多个记忆实体,每一记忆实体用于构建对应的知识图谱单元的学习资源的调用方式,其中,每一记忆实体用于与分类主体形成对应,并导入关联关系,以使得每一记忆实体与多维关联网络建立连接;从而构建出每一记忆实体基于多维关联网络来调用学习资源。
[0012]优选的,所述预测模型利用如下的方法进行构建:
[0013]选用至少一个数学知识样本集;
[0014]利用至少3组以上的人工专家分别对数学知识样本集中的数学知识样本进行人工标注,得到人工标注结果,且所述人工标注结果与对应的数学知识样本进行关联;
[0015]设置一比较器,将得到的所述人工标注结果输入至比较器进行比较,当至少一个所述人工标注结果之间相互一致时,则将所述数学知识样本选为预测样本,并将所述人工标注结果选为所述预测样本相应的特征向量;
[0016]采用所述训练样本和所述训练样本相应的特征向量进行训练得到基础预测模型;将大量的数学知识样本输入至基础预测模型进行反复多次训练,得到所述预测模型。
[0017]优选的,所述分析器从所述标注结果得到至少一个关键词或语句,并所述关键词或语句设置成标注特征;
[0018]在所述分析器中还设置有处理器和配置单元,
[0019]所述处理器用于计算每一标注特征出现的概率;
[0020]所述配置单元用于配置每一标注特征的属性,使得具有相同标注特征的属性也相同,同时并基于所述属性来配置标注特征排序。
[0021]优选的,所述属性表示为基于标注特征出现的概率而进行的赋值;赋值越高代表出现的概率越大,赋值越低代表出现的概率小;基于所述赋值来配置标注特征排序。
[0022]优选的,基于所述赋值由赋值的大小来配置标注特征排序。
[0023]优选的,所述关联器具有第一关联单元、第二关联单元以及第三关联单元;
[0024]所述第一关联单元基于标注特征的排序结果,依次调取标注特征以及所述标注特征所对应的标注结果,将具有相同的标注特征进行一维关联,形成一维关联网络;
[0025]所述第二关联单元连接第一关联单元,并调用一维关联网络,同时调取标注特征以及所述标注特征所对应的标注结果,将每一标注结果下的所有标注特征进行关联,并基于形成的一维关联网络来构建二维关联网络;
[0026]所述第三关联单元连接第二关联单元,并调用二维关联网络,同时调取标注结果以及所述标注结果所对应的数学知识样本,将具有相同标注结果的数学知识样本进行关联,并基于形成的二维关联网络来构建多维关联网络。
[0027]优选的,所述分类器用于与一个或者多个标注结果进行对应。
[0028]优选的,在所述知识图谱模型中,基于任务管理器中配置的记忆实体与多维关联网络构建的连接关系来调用学习资源至知识图谱单元。
[0029]本申请构建了基于分类的知识图谱,具体的获取待处理的数学知识样本,利用预测模型进行标注,得到至少一个标注结果;将标注结果进行分析,并提取至少一个标注特征,设置标注特征的属性,使得具有相同标注特征的属性也相同;基于标注特征将相同标注特征进行一维关联,形成一维关联网络;将每一标注结果下的所有标注特征进行关联,并基于形成的一维关联网络来构建二维关联网络,将具有相同标注结果的数学知识样本进行关
联,并基于形成的二维关联网络来构建多维关联网络;将多维关联网络中的标注结果引出与分类器再形成关联,并记录关联关系;设置多个并行设置的知识图谱单元以及一个任务管理器,所述任务管理器被配置成具有多个记忆实体,每一记忆实体用于构建对应的知识图谱单元的学习资源的调用方式,其中,每一记忆实体用于与分类主体形成对应,并导入关联关系,以使得每一记忆实体与多维关联网络建立连接;从而构建出每一记忆实体基于多维关联网络来调用学习资源。
[0030]本申请采用了符合本知识领域构建的预测模型,具体的,所述预测模型利用如下的方法进行构建:选用至少一个数学知识样本集;利用至少3组以上的人工专家分别对数学知识样本集中的数学知识样本进行人工标注,得到人工标注结果,且所述人工标注结果与对应的数学知识样本进行关联;设置一比较器,将得到的所述人工标注结果输入至比较器进行比较,当至少一个所述人工标注结果之间相互一致时,则将所述数学知识样本选为预测样本,并将所述人工标注结果选为所述预测样本相应的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于大数据的数学知识图谱构建方法,其特征在于,包括如下步骤:获取待处理的数学知识样本,利用预测模型进行标注,得到至少一个标注结果;设置一分析器,所述分析器用于将标注结果进行分析,并提取至少一个标注特征,设置标注特征的属性,使得具有相同标注特征的属性也相同;设置一关联器,基于标注特征将相同标注特征进行一维关联,形成一维关联网络;将每一标注结果下的所有标注特征进行关联,并基于形成的一维关联网络来构建二维关联网络,将具有相同标注结果的数学知识样本进行关联,并基于形成的二维关联网络来构建多维关联网络;设置一分类库,所述分类库由多个分类主体构成,其中,每一分类主体被配置成至少基于一个标注结果来建立一个对应的分类器,以使得在每一分类主体下形成多个并列的分类器;将多维关联网络中的标注结果引出与分类器再形成关联,并记录关联关系;构建知识图谱模型:设置多个并行设置的知识图谱单元以及一个任务管理器,所述任务管理器被配置成具有多个记忆实体,每一记忆实体用于构建对应的知识图谱单元的学习资源的调用方式,其中,每一记忆实体用于与分类主体形成对应,并导入关联关系,以使得每一记忆实体与多维关联网络建立连接;从而构建出每一记忆实体基于多维关联网络来调用学习资源。2.根据权利要求1所述的基于大数据的数学知识图谱构建方法,其特征在于,所述预测模型利用如下的方法进行构建:选用至少一个数学知识样本集;利用至少3组以上的人工专家分别对数学知识样本集中的数学知识样本进行人工标注,得到人工标注结果,且所述人工标注结果与对应的数学知识样本进行关联;设置一比较器,将得到的所述人工标注结果输入至比较器进行比较,当至少一个所述人工标注结果之间相互一致时,则将所述数学知识样本选为预测样本,并将所述人工标注结果选为所述预测样本相应的特征向量;采用所述训练样本和所述训练样本相应的特征向量进行训练得到基础预测模型;将大量的数学知识样本输入至基础预测模型进行反复多次训练,得到所述预测...

【专利技术属性】
技术研发人员:陈花竹高冉刘霞姜利敏贺金满徐忠朴魏冰蔗
申请(专利权)人:中原工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1