当前位置: 首页 > 专利查询>东南大学专利>正文

一种新型语义关联挖掘方法技术

技术编号:8271534 阅读:219 留言:0更新日期:2013-01-31 03:48
本发明专利技术公开了一种新型语义关联挖掘方法,包括步骤为:将输入的语义数据进行解析并聚类,形成语义数据簇并进行数据清洗,将资源描述框架图转化为类型对象图;对类型对象图进行分块或合并,得到多个分块;预测每个分块中潜在的链接模式和语义关联的数量级,预测结果反馈给二划分单元,对较大或结构复杂的分块进一步划分;挖掘出分块的局部链接模式和语义关联,将语义关联汇总和统计,输出给用户。通过上述方式,本发明专利技术提供的一种新型语义关联挖掘方法,该方法有高效、挖掘结果准确等特点,能刻画多个对象之间的复杂关联,并将链接模式用于衡量语义关联的典型性,使用图挖掘技术开展挖掘,提高了语义关联挖掘在大规模语义数据上的可行性和效率。

【技术实现步骤摘要】
本专利技术涉及信息检索领域,特别是涉及一种新型语义关联挖掘方法
技术介绍
随着语义网近十年来的蓬勃发展,在线语义数据越来越丰富,庞大的语义数据集构成了一个纷繁复杂的数据之网。语义网中的语义搜索主要关注语义对象和对象之间的语义关联,语义关联检索的目标是帮助用户找到并理解隐含在海量语义数据之中的对象之间直接或间接的联系。在语义网研究领域,语义关联通常被定义为对象在资源描述框架图中直接或间接的关系。对语义关联的建模通常沿用图论中有向路径的方式,对于给定的两个对象,语义关联发现的过程是快速找到对象在资源描述框架图中的一条或多条最短或较短路径。 语义关联的挖掘技术经历十年的发展已经取得了一定的成果,但相关技术仍然存在着不足。传统基于语义路径的语义关联模型仍存在局限性(1)传统语义路径只能刻画对象两两之间的语义关联,且每个语义关联互相独立,无法统一,无法刻画多个对象之间的复杂关联,但实际上多个对象大量的存在于真实语义数据中,应当统一为一个整体的语义关联;(2)语义路径模型并没有考虑语义关联的典型性,即具有语义关联的两个对象之间的语义路径是否也出现在其它语义关联中,在很多情况下,平凡的、不重要的语义路本文档来自技高网...

【技术保护点】
一种新型语义关联挖掘方法,其特征在于,包括步骤为:(1)将输入的语义数据进行解析并聚类,形成语义数据簇,对所述语义数据簇进行数据清洗,并将所述语义数据簇的资源描述框架图转化为类型对象图;(2)通过基本标记规则或优化标记规则对所述类型对象图进行分块或合并,得到多个分块,所述基本标记规则采用接近随机的标记方法,所述优化标记规则采用启发式规则;(3)预测所述每个分块中潜在的链接模式和语义关联的数量级,预测结果反馈给二划分单元,对较大或结构复杂的分块进一步划分;(4)挖掘出所述分块的局部链接模式和语义关联,再将所述局部链接模式和所述语义关联进行合并,将所述语义关联汇总和统计,输出给用户。

【技术特征摘要】
1.一种新型语义关联挖掘方法,其特征在于,包括步骤为 (1)将输入的语义数据进行解析并聚类,形成语义数据簇,对所述语义数据簇进行数据清洗,并将所述语义数据簇的资源描述框架图转化为类型对象图; (2)通过基本标记规则或优化标记规则对所述类型对象图进行分块或合并,得到多个分块,所述基本标记规则采用接近随机的标记方法,所述优化标记规则采用启发式规则; (3)预测所述每个分块中潜在的链接模式和语义关联的数量级,预测结果反馈给二划分单元,对较大或结构复杂的分块进一步划分; (4)挖掘出所述分块的局部链接模式和语义关联,再将所述局部链接模式和所述语义关联进行合并,将所述语义关联汇总和统计,输出给用户。2.根据权利要求I所述的新型语义关联挖掘方法,其特征在于,步骤(I)中所述资源描述框架图转化为类型对象图的过程为对资源描述框架图中的资源描述框架三元组进行过...

【专利技术属性】
技术研发人员:张祥
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1