The invention relates to an evolution of tracking subject ranking from context data. Systems, methods, and computer program products are disclosed that track network evolution over time by analyzing the media corpus associated with each time slice and network node. Media corpus can be analyzed to generate word clusters for each time slice, and then word clusters can be compared across time slices to determine how the network evolves. The evolution can be tracked by determining the similarity between each word cluster of a particular time slice and each word cluster of another time slice. The similarity can be measured by the similarity score of each comparison, and the similarity score can be combined to determine the overall similarity of the network between two time slices.
【技术实现步骤摘要】
从上下文数据跟踪主题排名的演变
技术介绍
本公开涉及用于基于主题与网络中的重要节点的连接来跟踪网络中的主题随时间的演变的系统和方法。在网络上发现的各种主题的流行度可能随时间而改变。例如,诸如新闻报道、政府声明、国内或国际事件、电影、新技术或其他类似主题等主题可以随着时间的推移在网络中经历增加或减少的曝光。
技术实现思路
本文中描述的系统、方法和计算机程序产品提供对网络中的主题随时间的演变的跟踪。在本公开的一个方面,公开了一种方法,其包括接收与网络相关联的时间序列数据,该时间序列数据包括在多个时间片的关于网络的数据。网络在每个时间片包括多个节点,其中在每个时间片的每个节点包括与至少一个媒体语料库相关联的属性。该方法还包括分析时间序列数据以针对每个时间片在网络中标识至少一个最重要节点,基于在每个时间片的所标识的至少一个最重要节点确定在每个时间片的网络的子网,其中子网包括网络的节点中的至少一些节点和所标识的至少一个最重要节点,分析与在每个时间片的子网中的每个节点的属性相关联的至少一个媒体语料库以确定针对该时间片的至少一个关键字簇,其中每个关键字簇包括多个关键字,将多个时间片中的第一时间片的至少一个关键字簇与多个时间片中的第二时间片的至少一个关键字簇进行比较,并且基于该比较确定第一时间片与第二时间片之间的相似性。在本公开的各方面,还可以提供根据以上方面的装置、系统和计算机程序产品。在不脱离本公开的范围的情况下,可以组合任何上述方面。附图说明通过参考附图可以理解关于本公开的结构和操作的细节 ...
【技术保护点】
1.一种由至少一个硬件处理器实现的方法,包括:/n接收与网络相关联的时间序列数据,所述时间序列数据包括在多个时间片的关于所述网络的数据,所述网络在每个时间片包括多个节点,在每个时间片的每个节点包括与至少一个媒体语料库相关联的属性;/n分析所述时间序列数据以针对每个时间片在所述网络中标识至少一个最重要节点;/n基于在每个时间片的所标识的所述至少一个最重要节点确定在每个时间片的所述网络的子网,所述子网包括所述网络的所述节点中的至少一些节点和所标识的所述至少一个最重要节点;/n分析与在每个时间片的所述子网中的每个节点的所述属性相关联的所述至少一个媒体语料库以确定针对所述时间片的至少一个关键字簇,每个关键字簇包括多个关键字;/n将所述多个时间片中的第一时间片的所述至少一个关键字簇与所述多个时间片中的第二时间片的所述至少一个关键字簇进行比较;以及/n基于所述比较确定所述第一时间片与所述第二时间片之间的相似性。/n
【技术特征摘要】
20180601 US 15/995,6531.一种由至少一个硬件处理器实现的方法,包括:
接收与网络相关联的时间序列数据,所述时间序列数据包括在多个时间片的关于所述网络的数据,所述网络在每个时间片包括多个节点,在每个时间片的每个节点包括与至少一个媒体语料库相关联的属性;
分析所述时间序列数据以针对每个时间片在所述网络中标识至少一个最重要节点;
基于在每个时间片的所标识的所述至少一个最重要节点确定在每个时间片的所述网络的子网,所述子网包括所述网络的所述节点中的至少一些节点和所标识的所述至少一个最重要节点;
分析与在每个时间片的所述子网中的每个节点的所述属性相关联的所述至少一个媒体语料库以确定针对所述时间片的至少一个关键字簇,每个关键字簇包括多个关键字;
将所述多个时间片中的第一时间片的所述至少一个关键字簇与所述多个时间片中的第二时间片的所述至少一个关键字簇进行比较;以及
基于所述比较确定所述第一时间片与所述第二时间片之间的相似性。
2.根据权利要求1所述的方法,还包括将针对所述多个时间片中的时间片的所述至少一个关键字簇链接到在所述时间片的所述子网中被包括的所述节点中的至少一个节点,所述链接基于针对所述时间片的所述至少一个关键字簇中的所述多个关键字被包括在所述媒体语料库中,所述媒体语料库与在所述时间片的所述子网中被包括的所述节点中的所述至少一个节点的所述属性相关联。
3.根据权利要求1所述的方法,其中确定所述第一时间片与所述第二时间片之间的所述相似性包括确定所述第一时间片的每个字簇与所述第二时间片的每个字簇之间的相似性得分。
...
【专利技术属性】
技术研发人员:M·E·赫兰德,E·A·雷,N·莱蒂夫,J·S·B·T·玛丽亚,K·R·瓦什奈伊,L·莱巴,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。