【技术实现步骤摘要】
一种知识图谱构建的方法、装置、电子设备及介质
本专利技术涉及信息处理
,特别是涉及一种知识图谱构建的方法、装置、电子设备及介质。
技术介绍
知识图谱用于描述真实世界中存在的各种实体,以及实体之间的关系,具体可以用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。以视频网站为例,目前视频网站中的知识图谱的构建的方法为,获取视频网站内的影视资料,并通过爬虫技术从各垂直网站中获取资料,然后通过预设的分类规则对获取到的资料进行分类,从而按照分类结果将各资料存入知识图谱中的相应的类别下,从而构建知识图谱。然而,现有技术中对资料分类过程中,使用的是人工设置的分类规则,由于人工获取信息的能力有限,所以设置的分类规则难以保证全面且准确,使用人工设置的分类规则进行分类的准确度难以保证,难以准确地构建知识图谱。
技术实现思路
本专利技术实施例的目的在于提供一种知识图谱构建的方法、装置、电子设备及装置,使构建的知识图谱有较高的准确性。具体技术方案如下:第一方面,本申请实 ...
【技术保护点】
1.一种知识图谱构建的方法,其特征在于,包括:/n获取待分类知识信息;/n将所述待分类知识信息输入分类模型,获取所述分类模型输出的所述待分类知识信息对应的分类结果;/n根据所述待分类知识信息对应的分类结果,将所述待分类知识信息加入所述知识图谱;/n其中,所述分类模型为基于训练集对深度学习模型进行多次训练得到的模型;针对所述训练集中的每个待训练知识信息,首次训练所使用的训练集包括的所述待训练知识信息的分类结果为基于预设分类规则对所述待训练知识信息确定的初始分类结果;/n针对所述训练集中的每个待训练知识信息,非首次训练所使用的训练集中包括的所述待训练知识信息的分类结果为:根据第 ...
【技术特征摘要】
1.一种知识图谱构建的方法,其特征在于,包括:
获取待分类知识信息;
将所述待分类知识信息输入分类模型,获取所述分类模型输出的所述待分类知识信息对应的分类结果;
根据所述待分类知识信息对应的分类结果,将所述待分类知识信息加入所述知识图谱;
其中,所述分类模型为基于训练集对深度学习模型进行多次训练得到的模型;针对所述训练集中的每个待训练知识信息,首次训练所使用的训练集包括的所述待训练知识信息的分类结果为基于预设分类规则对所述待训练知识信息确定的初始分类结果;
针对所述训练集中的每个待训练知识信息,非首次训练所使用的训练集中包括的所述待训练知识信息的分类结果为:根据第一置信度和第二置信度重新确定的分类结果,所述第一置信度为所述深度学习模型对所述待训练知识信息的分类结果的置信度,所述第二置信度为基于所述预设分类规则对所述待训练知识信息的初始分类结果的置信度。
2.根据权利要求1所述的方法,其特征在于,
若所述第一置信度和所述第二置信度满足预设条件,则所述根据第一置信度和第二置信度重新确定的分类结果为所述深度学习模型对所述待训练知识信息的分类结果;
若所述第一置信度和所述第二置信度不满足所述预设条件,则所述根据第一置信度和第二置信度重新确定的分类结果为所述待训练知识信息的初始分类结果;
其中,所述预设条件为:所述第一置信度大于模型置信度阈值,且所述第二置信度小于规则置信度阈值。
3.根据权利要求1或2所述的方法,其特征在于,所述待分类知识信息为预设知识库中的词条信息,所述待训练知识信息为所述预设知识库中的词条信息;所述获取待分类知识信息包括:
根据预设过滤规则对预设知识库中的词条信息进行过滤;
从过滤后的预设知识库中获取待分类词条信息。
4.一种知识图谱构建的方法,其特征在于,包括:
S1、获取待训练知识信息;
S2、根据获取的待训练知识信息构建训练集,所述训练集包括待训练知识信息以及基于预设分类规则确定的各待训练知识信息的初始分类结果;
S3、将所述训练集中的待训练知识信息输入所述深度学习模型,获取所述深度学习模型输出的对待训练知识信息的分类结果;
S4、针对所述训练集中的每个待训练知识信息,根据第一置信度和第二置信度,对所述深度学习模型进行训练,或者重新确定所述待训练知识信息的分类结果,并将所述训练集中的所述待训练知识信息的分类结果更新为重新确定的分类结果,得到更新后的训练集;所述第一置信度为所述深度学习模型对所述待训练知识信息的分类结果的置信度,所述第二置信度为基于预设分类规则对所述待训练知识信息的初始分类结果的置信度;
S5、基于更新后的训练集循环执行上述S3至S4,直至确定所述深度学习模型的分类精度达到预设精度阈值,或者循环执行次数达到预设次数,将所述深度学习模型作为分类模型,所述分类模型用于对待分类知识信息进行分类,以使得电子设备根据对所述待分类知识的分类结果,将所述待分类知识信息加入知识图谱。
5.根据权利要求4所述的方法,其特征在于,所述针对所述训练集中的每个待训练知识信息,根据第一置信度或第二置信度,对所述深度学习模型进行训练,或者重新确定所述待训练知识信息的分类结果,并将所述训练集中的所述待训练知识信息的分类结果更新为重新确定的分类结果,包括:
若所述第一置信度与所述第二置信度不满足预设条件,则根据所述深度学习模型输出的所述待训练知识信息的分类结果,以...
【专利技术属性】
技术研发人员:董小斐,陈伟,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。