【技术实现步骤摘要】
本申请涉及知识图谱,具体而言,涉及一种知识图谱构建方法、装置、存储介质和电子设备。
技术介绍
1、知识图谱是人类对客观世界认知所形成知识的一种表现形式,其通过特定的结构和分类方式组织并存储人们解决现实问题时所使用的知识。根据包含知识类型的不同,知识图谱问答可以分为开放域和封闭域两种场景。其中,封闭域知识图谱问答是将知识交互的范围限定在特定领域或者主体,其问题和答案的上下文较为受限;而开放域知识图谱问答中,问题和知识图谱中的知识可涉及任何主体、领域或者话题,因此,开放域知识图谱问答具备较为广阔的使用前景。
2、目前,开放域知识图谱的构建方案主要可分为两类:基于句法分析的技术路线和基于模型的技术路线。其中,基于句法分析的技术路线,其是先使用语法解析器拆分句子,得到句子中的主谓宾等成分,再使用分类器对所拆分的每个部分进行分类;而基于模型的技术路线,其是先使用监督数据进行训练模型,然后使用模型进行要素抽取并进行图谱构建。但上述两个方法仍存在如下弊端:一是构建精度较低。其中基于语法分析的技术路线,要求文本严格遵循语法,在非规范文本下,
...【技术保护点】
1.一种知识图谱构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述抽取模型的训练过程包括:
3.根据权利要求2所述的方法,其特征在于,获取多组样本数据,包括:
4.根据权利要求3所述的方法,其特征在于,所述语义编码器的训练过程包括:
5.根据权利要求4所述的方法,其特征在于,获取多组第二类三元组样本,包括:
6.根据权利要求4所述的方法,其特征在于,获取多组第二类三元组样本,包括:
7.根据权利要求3所述的方法,其特征在于,多个所述实体类型聚类中心的确定过程包括:
...【技术特征摘要】
1.一种知识图谱构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述抽取模型的训练过程包括:
3.根据权利要求2所述的方法,其特征在于,获取多组样本数据,包括:
4.根据权利要求3所述的方法,其特征在于,所述语义编码器的训练过程包括:
5.根据权利要求4所述的方法,其特征在于,获取多组第二类三元组样本,包括:
6.根据权利要求4所述的方法,其特征在于,获取多组第二类三元组样本,包括:
7.根据权利要求3所述的方法,其特征在于,多个所述实体类型聚类中心的确定过程包括:
8.根据权利要求3所述的方法,其特征在于,多个所述关系类型聚类中心的...
【专利技术属性】
技术研发人员:张鹏,阮宜龙,张云龙,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。