实现关联信息节点可视化追踪的数据处理方法技术

技术编号:13684016 阅读:27 留言:0更新日期:2016-09-08 19:42
本发明专利技术涉及互联网信息处理技术领域,特别涉及实现关联信息节点可视化追踪的数据处理方法。本发明专利技术方法通过设置字段等方式,从海量的信息中分析出目标主体以及与目标主体直接相关的关联信息形成,根据直接关联关系抽象出一度关联关系,形成对应的数据记录;根据不同数据记录中的相同的信息单元逐级扩展关联信息;并在关联关系数据的基础上,使用可视化工具,将关联关系可视化、图谱化,图谱路径清晰可实现关联节点的逐一追踪,为相关的数据分析提供参考,极大的节省了用户用于相关数据分析的人力和时间成本。在目标背景分析、市场调研、市场风险防控、产品推广、广告传播等应用领域具有极高的使用价值。

【技术实现步骤摘要】

本专利技术涉及互联网信息处理
,特别涉及实现关联信息节点可视化追踪的数据处理方法
技术介绍
今世界早就进入了信息时代,随着信息的爆发式增长和积累,大数据时代已近来临,作为大数据最重要的特点:数据量大和价值密度低却是困扰如此海量数据信息挖掘利用的难题。实际上在纷繁复杂的信息海洋中,某些信息之间的联系往往比与其他信息之间的联系要紧密得多,而这些具有某种紧密联系的信息往往反映的是现实生活中的人与人之间或者团体之间的特定关系,这些特定关系会使其在相关的社会或者经济活动中相互影响或者牵制。针对特定的信息目标,如何分析该目标与其他目标之间的关联关系在很多领域具有更加实际的意义,因为具有关联关系的目标在进行各种活动时往往比单独的简单个体具有更大的影响面,而且具有关联关系的目标在对外建立各种活动时,受到内部的关联关系的相互牵制或者支持,会比简单目标的活动轨迹更加复杂。在这样的背景下,通过数据挖掘在海量的数据信息中分析出与目标信息相关联的信息,并通过数据可视化工具将信息之间的关联关系直观的展示出来,将极大的节省用户用于数据整理和数据分析所耗费的人力、物力;在目标背景分析、市场调研、市场风险防控、产品推广、广告传播等应用领域具有极高的使用价值。
技术实现思路
本专利技术的目的在于克服现有技术中所存在的上述不足,提供实现关联信息节点可视化追踪的数据处理方法,本专利技术方法通过设置字段等方式,从海量的信息中分析出目标主体以及与目标主体直接相关的关联信息形成,根据直接关联关系成一度关联关系,形成对应的数据记录;根据不同数据记录中的相同的信息单元逐级扩展关联信息;并在关联关系数据的基础上,使用可视化工具,将关联关系可视化、图谱化,为相关的数据分析提供参考,极大的节省了用户用于相关数据分析的人力和时间成本。为实现上述目的,本专利技术实现关联信息节点可视化追踪的数据处理方法,包括以下步骤:(1)从原始数据中的每条基础数据中,根据设置的字段提取出对应的信息,形成相应的数据记录;(2)在一条数据记录中包含第一信息和第二信息,其中第二信息为第一信息的一度关联信息;在第二数据记录中包括第二信息和第三信息,其中第三信息是第二信息的一度关联信息;(3)将所述第三信息抽象成第一信息的二度关联信息;依次类推,抽象出以第一信息为起点的N度关联信息,其中N≥1;(4)根据所述步骤(3)形成的关联关系,利用可视化工具将第一信息抽象成0级节点,将第二信息作为第一信息的1级子节点扩展到第一信息节点的外围,将第三信息作为第二信息的1级子节点扩展到第二信息节点的外围;依次类推,扩展出以第一信息节点为中心的各级节点依次扩展在对应上一
级节点外围的关联图谱;各级母节点与子节点之间用边来连接。进一步的,关联关系的建立遵循广度优先原则。进一步的,关联图谱绘制的节点扩展遵循广度优先原则。作为一种优选,其可视化过程为:将目标信息置于可视化图的中心;将相同级数的节点分散在一个圆周上,并围绕在上一级节点围成的圆的外面。进一步的,所述关联图谱中,使用不同的颜色和,或不同形状来区分各级节点。进一步的,所述关联图谱中,使用不同颜色和,或不同形状来区分不同类型的节点。作为一种优选,所述步骤(4)中所采用的可视化工具为:yEd、D3或者jcharts。进一步的,所关联图谱通过Web端口提供给用户查询使用。与现有技术相比,本专利技术的有益效果:本实现关联信息节点可视化追踪的数据处理方法,通过设置字段等方式,从海量的信息中分析出目标主体以及与目标主体直接相关的关联信息形成,根据直接关联关系成一度关联关系,形成对应的数据记录;根据不同数据记录中的相同的信息单元逐级扩展关联信息;整理出目标信息的关联关系数据;并在关联关系数据的基础上,使用可视化工具,将关联关系可视化、图谱化,达到关联路径清晰、关联节点可延路径逐一追踪的作用,为相关的数据分析提供参考,极大的节省了用户用于相关数据分析的人力和时间成本。并且本专利技术在关联信息图谱化的基础上,通过颜色和图形将属于不同关联级数或者类型的节点区分开来,丰富了关联图谱显示的数据信息内容和层次。
使得用户只通过关联图谱可以清楚的分别出每个节点的级别和类型,进一步节省了数据整理分析的人力物力成本。在数据信息挖取,目标信息背景分析,关联问题追踪和分析等领域具有广阔的应用前景。附图说明:图1是实现关联信息节点可视化追踪的数据处理方法的实现步骤示意图。图2为本专利技术方法关联信息计算原理示意图。图3为实施例根据字段提取的数据记录示意图。图4为一度关联关系示意图。图5为以a为0级节点可视化3度关联图谱示意图。图6为以f为0级节点的可视化3度关联图谱示意图。图7为以k为0级节点的可视化3度关联图谱示意图。具体实施方式下面结合试验例及具体实施方式对本专利技术作进一步的详细描述。但不应将此理解为本专利技术上述主题的范围仅限于以下的实施例,凡基于本
技术实现思路
所实现的技术均属于本专利技术的范围。本专利技术提供实现关联信息节点可视化追踪的数据处理方法,包括如图1所示的以下步骤:(1)从原始数据中的每条基础数据中,根据设置的字段提取出对应的信息,形成相应的数据记录;字段的设置根据数据分析的目的而定,比如将目标信息设定为企业名称,而其他信息设置为企业相关的董事、高管和投资人;在相关网页中或者企业信息后,就可以通过设置上述字段将各个企业的中的基本信息提取出来。再根据各个公司相关信息中的共同信息就可以建立每个企业的关联
背景信息。(2)在一条数据记录中包含第一信息和第二信息,其中第二信息为第一信息的一度关联信息;在第二数据记录中包括第二信息和第三信息,其中第三信息是第二信息的一度关联信息;其中所述第一信息、第二信息以及第三信息是指信息的内容,不代表信息的顺序。(3)将所述第三信息抽象成第一信息的二度关联信息;依次类推,抽象出以第一信息为起点的N度关联信息,其中N≥1。通过本专利技术方法所述步骤(3)可以目标信息为起点(起点的选择根据分析需要来设置),逐级查找出与目标信息相关联的其他信息和关联度数,关联信息的计算原理如图2所示。(4)根据所述步骤(3)形成的关联关系,利用可视化工具将第一信息抽象成0级节点,将第二信息作为第一信息的1级子节点扩展到第一信息节点的外围,将第三信息作为第二信息的1级子节点扩展到第二信息节点的外围;依次类推,扩展出以第一信息节点为中心的各级节点依次扩展在对应上一级节点外围的关联图谱;各级母节点与子节点之间用边来连接。在分析出关联信息的基础上,将关联信息之间的关联关系通过可视化、图谱化的方式直观的展示出来,方便用户的信息查找和问题分析。并且用户可以根据关联图谱中的关联路径可以方便的实现关联关系的节点追踪。进一步的,关联关系的建立和关联图谱的绘制遵循广度优先原则。广度优先原则扩展节点的顺序是将某一层上的所有节点都搜索到之后才向下一层搜索;这样扩展节点的好处在于,所形成的图谱以目标信息为中心逐级扩展节点,用户根据分析深度的需要选择展示的关联图谱节点最高级数,在选择的级数以内,更够显示全部节点而不会出现遗漏,方便用户根据需要获得所需的全量数
据。进一步的,在进行关联图谱绘制时,将已计算过的0级节点打上墓碑标记(即在下一级关联信息搜索时,不再计算该节点;这样的做法本文档来自技高网
...

【技术保护点】
实现关联信息节点可视化追踪的数据处理方法,其特征在于,包括以下实现步骤:(1)从原始数据中的每条基础数据中,根据设置的字段提取出对应的信息,形成相应的数据记录;(2)在一条数据记录中包含第一信息和第二信息,其中第二信息为第一信息的一度关联信息;在第二数据记录中包括第二信息和第三信息,其中第三信息是第二信息的一度关联信息;(3)将所述第三信息抽象成第一信息的二度关联信息;依次类推,抽象出以第一信息为起点的N度关联信息,其中N≥1;(4)根据所述步骤(3)形成的关联关系,利用可视化工具将第一信息抽象成0级节点,将第二信息作为第一信息的1级子节点扩展到第一信息节点的外围,将第三信息作为第二信息的1级子节点扩展到第二信息节点的外围;依次类推,扩展出以第一信息节点为中心的各级节点依次扩展在对应上一级节点外围的关联图谱;各级母节点与子节点之间用边来连接。

【技术特征摘要】
1.实现关联信息节点可视化追踪的数据处理方法,其特征在于,包括以下实现步骤:(1)从原始数据中的每条基础数据中,根据设置的字段提取出对应的信息,形成相应的数据记录;(2)在一条数据记录中包含第一信息和第二信息,其中第二信息为第一信息的一度关联信息;在第二数据记录中包括第二信息和第三信息,其中第三信息是第二信息的一度关联信息;(3)将所述第三信息抽象成第一信息的二度关联信息;依次类推,抽象出以第一信息为起点的N度关联信息,其中N≥1;(4)根据所述步骤(3)形成的关联关系,利用可视化工具将第一信息抽象成0级节点,将第二信息作为第一信息的1级子节点扩展到第一信息节点的外围,将第三信息作为第二信息的1级子节点扩展到第二信息节点的外围;依次类推,扩展出以第一信息节点为中心的各级节点依次扩展在对应上一级节点外围的关联图谱;各级母节点与子节点之间用边来连接。2...

【专利技术属性】
技术研发人员:何宏靖范东来
申请(专利权)人:成都数联铭品科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1