【技术实现步骤摘要】
垂直行业数据的三元组构建方法、装置、电子设备及介质
[0001]本专利技术涉及计算机
,尤其涉及一种垂直行业数据的三元组构建方法、装置、电子设备及介质。
技术介绍
[0002]知识图谱广泛应用于互联网搜索和导购等行业场景,这类场景的数据量巨大,实体数量近似为无限集,对于构建三元组的主要技术要求是覆盖度尽可能大,对于三元组关系的准确性和置信度的精确性要求不高。
[0003]但是,在一些垂直行业领域,例如水利、工商管理等,用于构建知识图谱的实体类型和总数一般是有限集,且对于三元组关系的准确性要求比较高。联网场景里构建知识图谱常用的方法不能满足此要求,因此在垂直行业领域,知识图谱的构建常常大量甚至完全依赖人工标注,初次构建和后期持续维护的工作量都巨大,且难以保障质量。
技术实现思路
[0004]本专利技术提供了一种垂直行业数据的三元组构建方法、装置、电子设备及介质,能够在有限集的实体范围内构建知识图谱用到的三元组,极大提升构建效率,同时保障三元组关系的准确性。
[0005]根据本专利技术的一方 ...
【技术保护点】
【技术特征摘要】
1.一种垂直行业数据的三元组构建方法,其特征在于,所述方法包括:针对从相同垂直行业的多个实体中确定的每一个待处理实体组,对待处理实体组中两个实体之间的实体属性进行匹配得到至少一个实体属性关联组;对同一实体属性关联组中实体属性进行关联度加权,得到待处理实体组中两个实体的关联结果;依据待处理实体组中两个实体的关联结果,确定是否对待处理实体组中两个实体构建实体三元组。2.根据权利要求1所述的方法,其特征在于,对待处理实体组中两个实体之间的实体属性进行匹配得到至少一个属性关联组,包括:对待处理实体组中每个实体原有的实体属性进行归纳汇总,得到每个实体的实体属性分类;依据每个实体的实体属性分类,将同属一个属性分类的待处理实体组中两个实体之间的实体属性进行匹配,得到至少一个实体属性关联组。3.根据权利要求1所述的方法,其特征在于,对同一实体属性关联组中实体属性进行关联度加权,得到待处理实体组中两个实体的关联结果,包括:确定各所述实体属性关联组中两个实体属性的关联度,将同一所述实体属性关联组中的两个实体属性进行关联度加权;依据各所述实体属性关联组对应的关联度加权值,确定待处理实体组中两个实体的关联结果。4.根据权利要求3所述的方法,其特征在于,确定各所述实体属性关联组中两个实体属性的关联度,包括:针对每个所述实体属性关联组,确定所述实体属性关联组中各个实体属性的属性值;依据各个实体属性的属性值,确定所述实体属性关联组中两个实体属性之间的关联度。5.根据权利要求4所述的方法,其特征在于,将同一所述实体属性关联组中的两个实体属性进行关联度加权,包括:确定同一所述实体属性关联组中两个实体属性的权重将同一所述实体属性关联组中两个实体属性之间的关联度与两个实体属性的权重进行相乘,得到所述实体属性关联组对应的关联度加权值。6.根据权利要求3所述的方法,其特征在于,依据各所述实体属性关联组对应...
【专利技术属性】
技术研发人员:许志远,吴海燕,许玲,
申请(专利权)人:云粒智慧科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。