【技术实现步骤摘要】
知识结构持续扩展方法、装置、设备和介质
[0001]本专利技术自然语言处理
,尤其涉及一种知识结构持续扩展方法、装置、设备和介质。
技术介绍
[0002]知识是用来解释事物和解决问题的结构化信息,为了能够更加清楚明白地增进关于知识关系与规律认识,研究者们会依据一定的原则与方法,按照不同的方式、标准将具有共同特征的知识汇集归并成类,也即进行知识分类,形成具备秩序性的的知识体系。例如对于环境领域的知识架构,先按照环境属性划分成自然环境、人工环境和社会环境。而自然环境按环境要素,又可分为大气环境、水环境等。由此通过逐级的划分形成具备秩序性的环境知识体系,以便于后续根据划分好的环境知识体系进行一系列环境相关的研究。
[0003]然而随着社会的不断进步发展,基于对知识更加细致的研究,现有知识体系会不断新增若干个新知识,因此对于现有知识体系的持续扩展是非常重要的。其中持续扩展的主要任务是把新的待扩展的概念集合中的所有概念都插入现有知识体系,并更新相关概念的层次关系。然而传统的知识结构扩展方法,大多数聚焦于叶子节点的扩展,对 ...
【技术保护点】
【技术特征摘要】
1.一种知识结构持续扩展方法,其特征在于,包括:查找出待扩展知识节点在现有知识体系中的父节点;在所述父节点为非叶子节点的情况下,基于多节点标记方法在所述现有知识体系中查找出所述待扩展知识节点所有的孩子节点;基于所述父节点及所述所有的孩子节点,将所述待扩展知识节点插入至所述现有知识体系中。2.根据权利要求1所述的知识结构持续扩展方法,其特征在于,所述查找出待扩展知识节点在现有知识体系中的父节点,具体包括:查找出待扩展节点在现有知识体系中的至少一个待验证局部信息节点;构建出所述待扩展节点与各所述待验证局部信息节点之间的各条分类路径;基于预训练语言模型得到所述各条分类路径的评分,并从评分最高的分类路径中查找出父节点。3.根据权利要求2所述的知识结构持续扩展方法,其特征在于,所述基于预训练语言模型得到所述各条分类路径的评分,具体包括:基于自然语言生成模型生成所述各条分类路径的自然语言;将所述自然语言输入预训练语言模型,获得所述预训练语言模型输出的所述各条分类路径的评分。4.根据权利要求1所述的知识结构持续扩展方法,其特征在于,所述基于多节点标记方法在所述现有知识体系中查找出所述待扩展知识节点所有的孩子节点,具体包括:在所述现有知识体系中标记出所述待扩展知识节点所有的待验证孩子节点及所有的待验证孙子节点;基于自然语言生成模型将所述待扩展知识节点与各所述待验证孩子节点及各所述待验证孙子节点之间节点关系转换成待验证自然语言;将各所述待验证自然语言输入预训练语言模型,获得所述预训练语言模型输出的各所述待验证自然语言的评分;基于所述评分从所述所有的待验证孩子节点查找出孩子节点。5.根据权利要求4所述的知识结构持...
【专利技术属性】
技术研发人员:赵军,何世柱,刘康,夏飞,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。