【技术实现步骤摘要】
基于加密联邦学习的知识图谱表示学习增强方法和装置
本专利技术实例涉及人工智能的数据处理技术,尤其涉及一种基于加密联邦学习的知识图谱表示学习增强方法和装置。
技术介绍
联邦学习(FederatedLearning)是一种分布式机器学习技术,其利用不互通数据库中的信息进行跨数据库的全局机器学习模型训练。联邦学习技术能够在保证数据隐私安全及合法合规的基础上,实现多数据库共同建模,即共同训练一个机器学习模型,提升机器学习模型的效果。知识图谱(KnowledgeGraph)表示学习是语义网络的知识库。通过对自然实体及它们间关系的抽取得到以多关系图形式存储的机器学习语义模型。在知识图谱中,通过词向量中携带的语义信息对实体及关系进行表示。基于知识图谱对客观时间中实体及关系的表示,计算机系统能够更好地对互联网中的大数据进行组织、管理和学习理解。在自然语言处理(NLP)领域,词向量是用一个向量来表示一个词,从而将自然语言数学符号化,以便计算机对自然语言进行处理。更具体地说,在本专利中词向量是指知识图谱中实体节点的“知识词向量” ...
【技术保护点】
1.一种基于加密联邦学习的知识图谱表示学习增强方法,包括:/n在第一数据处理端,对第一知识图谱进行表征学习,获得该知识图谱中第一实体的第一词向量;/n在第二数据处理端,对第二知识图谱进行表征学习,获得该知识图谱中与所述第一实体对齐的第二实体的第二词向量;/n第二数据处理端接收同态加密的所述第一词向量,使用所述第一词向量和所述第二词向量以生成式对抗网络的形式进行联邦学习,获得所述第二实体的融合后的第三词向量;/n在第二数据处理端,将所述第二知识图谱中第二实体的第二词向量替换为所述第三词向量后,继续对第二知识图谱进行表征学习,以便获得该知识图谱中各个实体的增强后的第四词向量。/n
【技术特征摘要】
1.一种基于加密联邦学习的知识图谱表示学习增强方法,包括:
在第一数据处理端,对第一知识图谱进行表征学习,获得该知识图谱中第一实体的第一词向量;
在第二数据处理端,对第二知识图谱进行表征学习,获得该知识图谱中与所述第一实体对齐的第二实体的第二词向量;
第二数据处理端接收同态加密的所述第一词向量,使用所述第一词向量和所述第二词向量以生成式对抗网络的形式进行联邦学习,获得所述第二实体的融合后的第三词向量;
在第二数据处理端,将所述第二知识图谱中第二实体的第二词向量替换为所述第三词向量后,继续对第二知识图谱进行表征学习,以便获得该知识图谱中各个实体的增强后的第四词向量。
2.根据权利要求1所述的知识图谱表示学习增强方法,其特征在于,包括:
在第一数据处理端,对第一知识图谱进行表征学习,获得该知识图谱中第一实体的第一词向量以及该第一实体的一跳节点的第一词向量;
在第二数据处理端,对第二知识图谱进行表征学习,获得该知识图谱中与所述第一实体对齐的第二实体的第二词向量以及与所述第一实体一跳节点对齐的第二实体一跳节点的第二词向量;
第二数据处理端接收同态加密的所述第一词向量,使用所述第一词向量和所述第二词向量以生成式对抗网络的形式进行联邦学习,获得所述第二实体的以及一跳节点的融合后的第三词向量;
在第二数据处理端,将其所述第二知识图谱中第二实体的及第二实体一跳节点的第二词向量替换为所述第三词向量后,继续对第二知识图谱进行表征学习,以便获得该知识图谱中各个实体的增强后的第四词向量。
3.根据权利要求1所述的知识图谱表示学习增强方法,其特征在于,所述表征学习通过TransE方法进行表示嵌入。
4.根据权利要求1所述的知识图谱表示学习增强方法,其特征在于,所述以生成式对抗网络的形式进行联邦学习的步骤包括:
将第二数据提供方接收到的第一词向量的集合记为
,将第二知识图谱内与中各个第一词向量对应的第二词向量的集合记为;
根据所述生成式对抗网络中的生成器,学习所述生成式对抗网络中的判别器,使其能够区分随机采样于和的元素;
学习所述生成式对抗网络中的生成器,使其尽可能准确地将中的元素映射到中对应节点的词向量上,使得所述判别器难以判别出一个元素属于还是属于;
训练所述生成式对抗网络,并且,
以训练结束后获得的中的元素为第三词向量,
或者,
以训练结束后获得的中的元素与对应的Y中的元素求平均后获得的元素为第三词向量,
或者,
以训练结束后获得的中的元素与对应的Y中的元素求和后获得的元素为第三词向量。
5.根据权利要求1至4任一项所述的知识图谱表示学习增强方法,其特征在于:所述第二数据处理端向所述第一数据处理端共享所述...
【专利技术属性】
技术研发人员:刘明生,马伯元,张诣,温洪念,许爱雪,滕琦,杜林峰,赵尉钦,
申请(专利权)人:石家庄铁路职业技术学院,
类型:发明
国别省市:河北;13
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。