一种面向跨媒体知识推理任务的知识表示方法技术

技术编号：23558948 阅读：62 留言：0更新日期：2020-03-25 04:21

本发明专利技术提供了一种面向跨媒体知识推理任务的知识表示方法，该方法包括：抽取跨媒体知识图谱的RDF三元组信息，将跨媒体知识图谱RDF三元组数据表示为初始的低维向量；利用最大间隔成本函数训练正负例三元组样本之间的向量表示，同时挖掘正负例三元组样本间的相似性(或差异性)，添加到最大间隔成本函数中，提高模型知识推理识别相似实体的能力。本发明专利技术能够对基于RDF构建的跨媒体知识图谱三元组进行知识表示和知识推理，利用本发明专利技术学习到的知识推理模型进行实体链接和知识分类，能够提高跨媒体知识图谱中的链接预测和三元组分类的准确度。

A knowledge representation method for cross media knowledge reasoning task

全部详细技术资料下载

【技术实现步骤摘要】
一种面向跨媒体知识推理任务的知识表示方法
本专利技术涉及一种面向跨媒体知识推理任务的知识表示方法，属于自然语言处理、人工智能等
，具体涉及一种针对跨媒体知识图谱中RDF三元组的知识推理方法，包括对知识图谱的链接预测和分类。
技术介绍
伴随着大数据时代的发展，各行各业的数据呈现爆炸式的增长，知识图谱(KnowledgeGraph)为高效利用这些海量的数据资源提供了一个强大的引擎。现在主流的知识图谱已经发展成为支撑众多人工智能(ArtificialIntelligence，简称AI)应用的核心，常见的AI应用包括智能搜索、自动问答、推荐系统、决策支持等。虽然在过去的十几年中，知识图谱取得了巨大的发展，但是还存在着一些局限，其中知识图谱不能包含所有的知识就是一个重大的局限，知识图谱的不完整性严重制约了AI领域中应用程序的效能，如何通过现有的知识补充完全知识图谱中所有的知识逐渐成为了知识图谱领域里亟待解决的问题之一。目前，知识图谱补全(KnowledgeGraphCompletion，KGC)是弥补这一局限的重要技术手段，知识图谱补全旨在补全知识图谱中不完整的知识，其中最重要的方法就是知识推理。近几年来，利用深度学习的方法提出了一些列的知识表示方法，但是这些知识表示方法在知识推理方面存在着推理精确度较低的问题，另外国内外现在主流的基于知识表示的知识图谱推理工作主要包括TransE(BordesA,UsunierN,GarcíaduránA,etal.TranslatingEmbeddingsforModelin...

【技术保护点】
1.一种面向跨媒体知识推理任务的知识表示方法，其特征在于：包括以下步骤：/n①跨媒体知识图谱三元组抽取：抽取跨媒体知识图谱中的数据，并转化为RDF三元组形式；/n②数据预处理：统计RDF三元组的头实体、关系和尾实体数据，进行数据预处理；/n③训练模型：输入训练模型，使用训练模型对三元组数据的特征进行训练，获取知识推理模型；/n④链接预测、三元组分类：输入跨媒体知识图谱链接预测和三元组分类模型，对知识推理模型进行链接预测以及分类。/n

【技术特征摘要】
1.一种面向跨媒体知识推理任务的知识表示方法，其特征在于：包括以下步骤：
①跨媒体知识图谱三元组抽取：抽取跨媒体知识图谱中的数据，并转化为RDF三元组形式；
②数据预处理：统计RDF三元组的头实体、关系和尾实体数据，进行数据预处理；
③训练模型：输入训练模型，使用训练模型对三元组数据的特征进行训练，获取知识推理模型；
④链接预测、三元组分类：输入跨媒体知识图谱链接预测和三元组分类模型，对知识推理模型进行链接预测以及分类。

2.如权利要求1所述的面向跨媒体知识推理任务的知识表示方法，其特征在于：所述步骤②中，数据预处理为：分别将实体数据和关系数据保存，去除重复的实体、关系数据，过滤不符合规范的实体和关系数据，并去除非法字符。

3.如权利要求1所述的面向跨媒体知识推理任务的知识表示方法，其特征在于：所述步骤④中，三元组分类模型用于判断三元组是否正确，跨媒体知识图谱链接预测模型用于补全图谱。

4.如权利要求1所述的面向跨媒体知识推理任务的知识表示...

【专利技术属性】
技术研发人员：昌攀，曹扬，王进，刘汪洋，
申请(专利权)人：中电科大数据研究院有限公司，
类型：发明
国别省市：贵州;52

全部详细技术资料下载我是这个专利的主人