用于跨站点数据分析的方法和系统技术方案

技术编号:10040239 阅读:179 留言:0更新日期:2014-05-14 10:50
本发明专利技术公开了一种用于配电管理的方法和系统。例如,提供一种跨站点数据分析方法,该方法包括:基于初始用户集中的至少一个用户在第一站点和第二站点中的动作标识所述第一站点与所述第二站点的至少一个动作关联特征,该初始用户集中的用户是第一站点和第二站点的成员;以及基于至少一个动作关联特征确定在第一站点中注册的第一用户名与在第二站点中注册的第二用户名是否属于同一用户。根据本发明专利技术的实施例,可以有效地判别不同站点中的相同的用户,即使他们的用户名不同。由此,可以通过在站点之间共享信息而向用户提供定制的信息服务。

【技术实现步骤摘要】

本专利技术总体上涉及数据分析领域,并且更具体地,涉及用于跨站点的数据分析的方法和系统。
技术介绍
目前网络已经成为了人们日常访问、浏览、存储和交换信息的常用媒介。从终端用户的角度看,可以通过网络上的站点(或简称“网站”)与网络信息进行交互。随着网络技术的发展,越来越多的站点能够利用数据分析之类的技术挖掘和学习用户的特性,例如交互习惯、偏好、兴趣等等,并且在此基础上为用户提供个性化的和/或定制的信息服务。例如,视频服务网站能够根据用户以往的浏览历史和交互行为推断用户潜在地对哪类信息比较感兴趣,并且将与此类信息有关的视频剪辑以醒目的方式推荐或者显示给用户。然而,不同的站点甚至同一站点的不同栏目可能采用各自不同的算法和机制执行关于用户的数据分析,这不利于改善用户体验和操作效率。具体而言,假设一个站点通过对用户一段时间的分析和学习已经积累了关于该用户的知识并且可以由此提供定制信息服务。然而,当该用户访问另一站点时,在先前站点积累的用户知识无法被当前站点利用,甚至当这两个站点由同一供应商运营时也可能如此。因此,该用户在新站点交互时无法直接获得定制的个性化服务,而是必须等待该站点从头开始利用数据分析来学习用户的特性。解决上述问题的一个可行途径是借助于用户在不同站点的用户名。可以理解,很多站点在允许用户使用该站点的功能之前要求用户进行注册成为该站点的成员。用户在站点的用户名通常是由用户<br>选择的,例如由字母、数字和某些特定符号组成。现有技术解决方案通常基于如下假设:如果两个站点存在相同的用户名,则认为该用户名对应的是同一个用户。相应地,与该用户名相关联的用户知识和分析结果可以在这两个站点之间共享。但是,同一用户在不同的站点可能具有不同的用户名。首先,由不同供应商运营的站点的用户命名机制通常是彼此隔离的。不同的站点供应商可能采用不同的用户名注册机制。而且,用户可能出于其他多种原因而在不同的站点采用不同的用户名,例如用户名被其他用户抢先注册、主观愿望,等等。因此,仅仅依靠完全相同的用户名来执行跨站点数据分析在可靠性和稳定性方面均存在缺陷。
技术实现思路
鉴于现有技术中存在的上述问题以及其他潜在问题,本领域中需要一种改进的跨站点数据分析解决方案。为此,本专利技术提供一种用于跨站点数据分析的方法和系统。在本专利技术的一个方面,提供一种跨站点数据分析方法。该方法包括:基于初始用户集中的至少一个用户在第一站点和第二站点中的动作标识所述第一站点与所述第二站点的至少一个动作关联特征,所述初始用户集中的用户是所述第一站点和所述第二站点的成员;以及基于所述至少一个动作关联特征确定在所述第一站点中注册的第一用户名与在所述第二站点中注册的第二用户名是否属于同一用户。在本专利技术的另一方面,提供一种跨站点数据分析系统。该系统包括:特征标识单元,被配置为基于初始用户集中的至少一个用户在第一站点和第二站点中的动作标识所述第一站点与所述第二站点的至少一个动作关联特征,所述初始用户集中的用户是所述第一站点和所述第二站点的成员;以及用户判别单元,被配置为基于所述至少一个动作关联特征确定在所述第一站点中注册的第一用户名与在所述第二站点中注册的第二用户名是否属于同一用户。通过下文描述将会清楚,根据本专利技术的实施例,能够有效地发现不同网站之间的潜在相同用户,从而实现跨网络的信息共享和互动。。附图说明通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件:图1示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器12的框图;图2示出了根据本专利技术一个示例性实施例的跨站点数据分析方法200的流程图;图3示出了根据本专利技术一个示例性实施例的跨站点数据分析方法300的流程图;以及图4示出了根据本专利技术一个示例性实施例的跨站点数据分析系统400的框图。具体实施方式下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。所属
的技术人员知道,本专利技术可以实现为系统、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本专利技术还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是-但不限于-电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括-但不限于-电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括-但不限于-无线、电线、光缆、RF等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言-诸如J本文档来自技高网
...
用于跨站点数据分析的方法和系统

【技术保护点】
一种跨站点数据分析方法,包括:基于初始用户集中的至少一个用户在第一站点和第二站点中的动作标识所述第一站点与所述第二站点的至少一个动作关联特征,所述初始用户集中的用户是所述第一站点和所述第二站点的成员;以及基于所述至少一个动作关联特征确定在所述第一站点中注册的第一用户名与在所述第二站点中注册的第二用户名是否属于同一用户。

【技术特征摘要】
1.一种跨站点数据分析方法,包括:
基于初始用户集中的至少一个用户在第一站点和第二站点中的
动作标识所述第一站点与所述第二站点的至少一个动作关联特征,
所述初始用户集中的用户是所述第一站点和所述第二站点的成员;
以及
基于所述至少一个动作关联特征确定在所述第一站点中注册的
第一用户名与在所述第二站点中注册的第二用户名是否属于同一用
户。
2.根据权利要求1所述的方法,其中基于初始用户集中的至少
一个用户在第一站点和第二站点中的动作标识所述第一站点与所述
第二站点的至少一个动作关联特征包括:
确定所述至少一个用户在所述第一站点中执行的第一动作与在
所述第二站点中执行的第二动作之间的时间间隔;以及
基于所述时间间隔标识时间间隔特征作为所述至少一个动作关
联特征之一。
3.根据权利要求2所述的方法,其中所述第一动作是在所述第
一站点中发布内容,并且其中所述第二动作是在所述第二站点中引
用在所述第一站点中发布的所述内容。
4.根据权利要求1所述的方法,其中基于初始用户集中的至少
一个用户在第一站点和第二站点中的动作标识所述第一站点与所述
第二站点的至少一个动作关联特征包括:
确定所述至少一个用户在所述第二站点中对所述第一站点中与
所述至少一个用户相关的内容的引用数目;以及
基于所述引用数目标识引用数目特征作为所述至少一个动作关
联特征之一。
5.根据权利要求1所述的方法,其中基于初始用户集中的至少
一个用户在第一站点和第二站点中的动作标识所述第一站点与所述

\t第二站点的至少一个动作关联特征包括:
确定所述至少一个用户在所述第二站点中对所述第一站点中与
所述至少一个用户相关的内容的引用数目与所述第一站点中与所述
至少一个用户相关的内容总数之间的比率;以及
基于所述比率标识引用比率特征作为所述至少一个动作关联特
征之一。
6.根据权利要求1所述的方法,其中基于初始用户集中的至少
一个用户在第一站点和第二站点中的动作标识所述第一站点与所述
第二站点的至少一个动作关联特征包括:
确定所述第一站点中与所述至少一个用户相关的内容与所述第
二站点中与所述至少一个用户相关的内容之间的相似度;以及
基于所述相似度标识内容相似度特征作为所述至少一个动作关
联特征之一。
7.根据权利要求1所述的方法,其中所述初始用户集中的至少
一个用户在所述第一站点和所述第二站点具有相同的用户名。
8.根据权利要求1所述的方法,进一步包括:
如果确定所述第一用户名和所述第二用户名属于同一用户,则在
所述第一站点与所述第二站点之间共享与所述用户相关的信息。
9.根据权利要求1-8任一项所述的方法,其中基于所述至少一
个动作关联特征确定在所述第一站点中注册的第一用户名与在所述
第二站点中注册的第二用户名是否属于同一用户包括:
如果由所述第一用户名对应的用户在所述第一站点中执行的动
作与由所述第二用户名对应的用户在所述第二站点中执行的动作具
有所述至少一个动作关联特征中的一个或多个特征...

【专利技术属性】
技术研发人员:包胜华郭宏蕾郭志立苏中
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1