知识表示方法、系统、存储介质以及计算机设备技术方案

技术编号：33190653 阅读：11 留言：0更新日期：2022-04-24 00:18

本发明专利技术适用于知识表示技术领域，提供了一种知识表示方法、系统、存储介质以及计算机设备，所述知识表示方法基于现有的知识图谱，包括：获取用户下载的多个软件，获取多个所述软件对应的标签；获取各个所述标签的相似标签；将所述标签以及所述相似标签构成三元组，所述三元组为第一三元组，所述第一三元组形成第一知识图谱；将所述现有的知识图谱与所述第一知识图谱进行融合形成第二知识图谱；所述第二知识图谱中的三元组为第二三元组；基于广度优先搜索算法BFS对所述第二知识图谱进行采样，获得样本三元组；对所有所述样本三元组进行表示学习。借此，本发明专利技术可以丰富知识和提高泛化性能。能。能。

全部详细技术资料下载

【技术实现步骤摘要】
知识表示方法、系统、存储介质以及计算机设备

[0001]本专利技术涉及知识表示
，尤其涉及一种知识表示方法、系统、存储介质以及计算机设备。

技术介绍

[0002]在计算机视觉、自然语言处理、推荐系统，神经网络、深度学习的应用越来越广泛。在深度学习的应用过程中，Embedding这样一种将离散变量转变为连续向量的方式为神经网络在各方面的应用带来了很大帮助。其中基于知识图谱表示学习已经获得了广泛关注，且已在一些工业场景成功落地。
[0003]在真实工程应用中，存在人工标记知识或者知识缺失的情况。人工标记知识成本较高，且将人力浪费在标注数据上，如果知识欠缺那么会导致知识表达不够充分，学习效果不好的问题。同时，目前的知识图谱表示学习，大多数主要基于直接相连的三元组构建训练数据，泛化性低以及难以学习网络结构表达。
[0004]综上所述，现有技术在实际使用上显然存在不便与缺陷，所以有必要加以改进。

技术实现思路

[0005]针对上述的缺陷，本专利技术的目的在于提供一种知识表示方法、系统、存储介质以及计算机设备，可以丰富知识和提高泛化性能。
[0006]为了实现上述目的，本专利技术提供了一种知识表示方法，基于现有的知识图谱，包括：
[0007]获取用户下载的多个软件，获取多个所述软件对应的标签；
[0008]获取各个所述标签的相似标签；
[0009]将所述标签以及所述相似标签构成三元组，所述三元组为第一三元组，所述第一三元组形成第一知识图谱；
[0010...

【技术保护点】

【技术特征摘要】
1.一种知识表示方法，基于现有的知识图谱，其特征在于，包括：获取用户下载的多个软件，获取多个所述软件对应的标签；获取各个所述标签的相似标签；将所述标签以及所述相似标签构成三元组，所述三元组为第一三元组，所述第一三元组形成第一知识图谱；将所述现有的知识图谱与所述第一知识图谱进行融合形成第二知识图谱；所述第二知识图谱中的三元组为第二三元组；基于广度优先搜索算法BFS对所述第二知识图谱进行采样，获得样本三元组；对所有所述样本三元组进行表示学习。2.根据权利要求1所述的知识表示方法，其特征在于，获取用户下载的多个软件，获取多个所述软件对应的标签的步骤包括：根据所述用户的软件下载行为获取多个所述软件的ID，构成软件的ID序列；分别将多个所述软件的ID映射为所述软件对应的标签的ID，获得所述标签的ID序列。3.根据权利要求2所述的知识表示方法，其特征在于，获取各个所述标签的相似标签的步骤包括：将所述标签的ID序列中的各个所述标签的ID进行向量表示；根据两两所述标签的ID的所述向量表示计算两两所述标签的相似度；根据两两所述标签的相似度获得各个所述标签的相似标签。4.根据权利要求3所述的知识表示方法，其特征在于，所述将所述标签的ID序列中的所述标签的ID进行向量表示的步骤包括：将所述标签的ID序列输入至word2vec模型进行训练；基于训练后的所述word2vec模型获得所述标签的ID的Embedding向量表示。5.根据权利要求4所述的知识表示方法，其特征在于，两两所述标签的相似度大于预定阈值时，两两所述标签互为相似标签，所述根据两...

【专利技术属性】
技术研发人员：王斌锋，乔建行，马征，
申请(专利权)人：北京鸿享技术服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人