跨平台数据匹配方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:17265295 阅读:41 留言:0更新日期:2018-02-14 12:45
本发明专利技术涉及一种跨平台数据匹配方法,具体包括如下步骤:接收终端发送的数据匹配请求;在第一社交网络平台中获取第一用户群组对应的群组行为数据,学习群组行为数据,得到群组特征分布函数;在第二社交网络平台中获取指定的根节点用户的关联用户以及对应的行为数据;学习根节点用户的行为数据,生成匹配根节点用户后的群组特征分布函数;对关联用户的行为数据进行行为学习;计算匹配关联用户后的群组特征分布函数的最大熵值,将对应最大熵值最大的关联用户确定为第一用户群组的匹配用户;以确定的匹配用户为当前根节点用户,确定下一个匹配用户,直至确定的匹配用户满足设定数量条件,完成群组匹配。上述方法能够实现不同社交网络平台的数据匹配。

Cross platform data matching methods, devices, computer devices, and storage media

The invention relates to a method, cross platform data, and includes the following steps: receiving data transmitted by a terminal matching request; group behavior data acquisition the first corresponding user group in the first social network platform, group learning behavior data, get the group distribution function; get the root user specified nodes in the social network platform of the second the associated user behavior data and the corresponding data; the root node user learning behavior, generating match group characteristic function distribution of the root node after a user behavior; data on the association of user behavior study; the calculation of the maximum entropy distribution function associated with the user group, after the corresponding maximum entropy maximum associated with the user to determine the matching user the first group of users; to determine the root node for the current user, the user, to determine the next. The matching user is matched until the determined matching user meets the set quantity conditions and completes the group matching. The above method can achieve data matching of different social network platforms.

【技术实现步骤摘要】
跨平台数据匹配方法、装置、计算机设备和存储介质
本专利技术涉及计算机
,特别是涉及一种跨平台数据匹配方法、装置、计算机设备和存储介质。
技术介绍
社交网络已成为感知个体在线行为的“传感器”,大量的社交“传感器”可以感知用户不同层面的信息,包括姓名、年龄、性别、消费能力、交友习惯、支付习惯、购物倾向以及对某种观点、商品和服务的态度等。在金融大数据应用中,不同的社交网络中连接相同的真实用户,不同社交网络平台上的相同用户发布的内容很可能是不相同的(主题不一样,例如美食社交网络的和图片社交网络的信息很难匹配;发表的内容规模不一样,比如一个新的平台和用了很久的平台的内容密度是不同的),那么,用这些不同的内容难以进行用户身份匹配,最终导致跨平台数据融合障碍,以致大数据分析仅局限于单一社交网络平台,分析效果差,大数据不能够得到充分利用。
技术实现思路
基于此,有必要针对上述问题,提供一种能够实现不同社交网络平台的数据匹配的跨平台数据匹配方法、装置、计算机设备和存储介质。一种跨平台数据匹配方法,所述方法包括:接收终端发送的数据匹配请求,所述数据匹配请求中携带第一社交网络平台标识、用户指定的第一社交网络平台中的第一用户群组以及第二社交网络平台标识和用户指定的第二社交网络平台中的根节点用户;在所述第一社交网络平台标识对应的第一社交网络平台中获取所述第一用户群组对应的群组行为数据,并对所述群组行为数据进行行为学习,得到所述第一用户群组对应的群组特征分布函数;在所述第二社交网络平台中获取所述根节点用户的关联用户,并在所述第二社交网络平台中获取所述根节点用户和每个所述关联用户对应的行为数据;基于所述第一用户群组对应的群组特征分布函数,学习所述根节点用户的行为数据,生成匹配根节点用户后的群组特征分布函数;基于匹配根节点用户后的群组特征分布函数,分别对每个关联用户的行为数据进行行为学习,生成匹配每个所述关联用户后的群组特征分布函数;计算匹配所述关联用户后的所述群组特征分布函数的最大熵值,将对应最大熵值最大的所述关联用户确定为所述第一用户群组的匹配用户;以确定的所述匹配用户为当前根节点用户,确定下一个匹配用户,直至确定的所述匹配用户满足设定数量条件,完成群组匹配。在一个实施例中,所述指定的根节点用户的关联用户为在所述第二社交网络平台中与所述根节点用户之间的亲密度不小于设定阈值的用户节点,其中,所述设定阈值根据所述第一用户群组的亲密度而设定。在一个实施例中,所述以确定的所述匹配用户为当前根节点用户,确定下一个匹配用户,直至确定的所述匹配用户满足设定数量条件,完成群组匹配的步骤为:以确定的所述匹配用户为当前根节点用户,在所述第二社交网络平台中查找所述当前根节点用户的当前关联用户,其中,查找的所述当前关联用户与确定的所有匹配用户和所述指定的根节点组成的群组的群组亲密度不小于设定阈值;在所述当前关联用户中确定下一个匹配用户,直至确定的所述匹配用户满足设定数量条件,完成群组匹配。在一个实施例中,所述在所述第一社交网络平台标识对应的第一社交网络平台中获取所述第一用户群组对应的群组行为数据,并对所述群组行为数据进行行为学习,得到所述第一用户群组对应的群组特征分布函数的步骤包括:在所述第一社交网络平台标识对应的第一社交网络平台中获取所述第一用户群组对应的群组行为数据;提取所述群组行为数据中的特征词语,根据所述特征词语生成多个特征向量,其中,所述特征向量都是由属于同一类别的特征词语构成的;依次根据所述第一用户群组中每个用户对应的行为数据中出现所述特征词语的频率信息修正每个所述特征向量对应的特征分布值,进而得到所述第一用户群组对应的群组特征分布函数。在一个实施例中,所述基于所述第一用户群组对应的群组特征分布函数,学习所述根节点用户的行为数据,生成匹配根节点用户后的群组特征分布函数的步骤为:以根据所述第一用户群组对应的群组行为数据所提取的所述特征向量为行为学习的基础,学习所述根节点用户的行为数据以修正每个所述特征向量对应的特征分布值,生成匹配所述根节点用户后的群组特征分布函数。一种跨平台数据匹配装置,所述装置包括:匹配请求模块,用于接收终端发送的数据匹配请求,所述数据匹配请求中携带第一社交网络平台标识、用户指定的第一社交网络平台中的第一用户群组以及第二社交网络平台标识和用户指定的第二社交网络平台中的根节点用户;群组特征学习模块,用于在所述第一社交网络平台标识对应的第一社交网络平台中获取所述第一用户群组对应的群组行为数据,并对所述群组行为数据进行行为学习,得到所述第一用户群组对应的群组特征分布函数;待匹配节点确定模块,用于在所述第二社交网络平台中获取所述根节点用户的关联用户,并在所述第二社交网络平台中获取所述根节点用户和每个所述关联用户对应的行为数据;根节点特征学习模块,用于基于所述第一用户群组对应的群组特征分布函数,学习所述根节点用户的行为数据,生成匹配所述根节点用户后的群组特征分布函数;关联节点特征学习模块,用于基于匹配所述根节点用户后的群组特征分布函数,分别对每个关联用户的所述行为数据进行行为,生成匹配每个所述关联用户后的群组特征分布函数;匹配模块,用于计算匹配所述关联用户后的所述群组特征分布函数的最大熵值,将对应最大熵值最大的所述关联用户确定为所述第一用户群组的匹配用户,以确定的所述匹配用户为当前根节点用户,确定下一个匹配用户,直至确定的所述匹配用户满足设定数量条件,完成群组匹配。在一个实施例中,所述指定的根节点用户的关联用户为在所述第二社交网络平台中与所述根节点用户之间的亲密度不小于设定阈值的用户节点,其中,所述设定阈值根据所述第一用户群组的亲密度而设定。在一个实施例中,所述群组特征学习模块包括:群组行为数据获取模块,用于在所述第一社交网络平台标识对应的第一社交网络平台中获取所述第一用户群组对应的群组行为数据;特征向量学习模块,用于提取所述群组行为数据中的特征词语,根据所述特征词语生成多个特征向量,其中,所述特征向量都是由属于同一类别的特征词语构成的;特征分布值计算模块,用于依次根据所述第一用户群组中每个用户对应的行为数据中出现所述特征词语的频率信息修正每个所述特征向量对应的特征分布值,进而得到所述第一用户群组对应的群组特征分布函数。一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可执行指令,所述处理器执行所述计算机可执行指令时实现上述所述方法的步骤。一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现上述所述方法的步骤。上述跨平台数据匹配方法、装置、计算机设备和存储介质,通过学习源社交网络平台内待匹配的用户群组的群组行为特征,以目标社交网络平台内指定的用户节点作为第一个匹配的根节点用户,并通过社交网路关系,在目标社交网络中查找该根节点用户的关联用户,在这些关联用户中确定继根节点用户后的下一个匹配用户,即在已经学习的行为特征的基础上进行这些关联用户的匹配,得到匹配每个关联用户后的群组特征分布函数,并计算分布函数对应的最大熵,将熵值最大的关联用户确定为匹配用户;再以新确定的匹配用户为根节点用户,重复上述行为学习过程,确定下一个匹配用户,直至确定的用户达到设定数量,本文档来自技高网...
跨平台数据匹配方法、装置、计算机设备和存储介质

【技术保护点】
一种跨平台数据匹配方法,所述方法包括:接收终端发送的数据匹配请求,所述数据匹配请求中携带第一社交网络平台标识、用户指定的第一社交网络平台中的第一用户群组以及第二社交网络平台标识和用户指定的第二社交网络平台中的根节点用户;在所述第一社交网络平台标识对应的第一社交网络平台中获取所述第一用户群组对应的群组行为数据,并对所述群组行为数据进行行为学习,得到所述第一用户群组对应的群组特征分布函数;在所述第二社交网络平台中获取所述根节点用户的关联用户,并在所述第二社交网络平台中获取所述根节点用户和每个所述关联用户对应的行为数据;基于所述第一用户群组对应的群组特征分布函数,学习所述根节点用户的行为数据,生成匹配根节点用户后的群组特征分布函数;基于匹配根节点用户后的群组特征分布函数,分别对每个关联用户的行为数据进行行为学习,生成匹配每个所述关联用户后的群组特征分布函数;计算匹配所述关联用户后的所述群组特征分布函数的最大熵值,将对应最大熵值最大的所述关联用户确定为所述第一用户群组的匹配用户;以确定的所述匹配用户为当前根节点用户,确定下一个匹配用户,直至确定的所述匹配用户满足设定数量条件,完成群组匹配。

【技术特征摘要】
1.一种跨平台数据匹配方法,所述方法包括:接收终端发送的数据匹配请求,所述数据匹配请求中携带第一社交网络平台标识、用户指定的第一社交网络平台中的第一用户群组以及第二社交网络平台标识和用户指定的第二社交网络平台中的根节点用户;在所述第一社交网络平台标识对应的第一社交网络平台中获取所述第一用户群组对应的群组行为数据,并对所述群组行为数据进行行为学习,得到所述第一用户群组对应的群组特征分布函数;在所述第二社交网络平台中获取所述根节点用户的关联用户,并在所述第二社交网络平台中获取所述根节点用户和每个所述关联用户对应的行为数据;基于所述第一用户群组对应的群组特征分布函数,学习所述根节点用户的行为数据,生成匹配根节点用户后的群组特征分布函数;基于匹配根节点用户后的群组特征分布函数,分别对每个关联用户的行为数据进行行为学习,生成匹配每个所述关联用户后的群组特征分布函数;计算匹配所述关联用户后的所述群组特征分布函数的最大熵值,将对应最大熵值最大的所述关联用户确定为所述第一用户群组的匹配用户;以确定的所述匹配用户为当前根节点用户,确定下一个匹配用户,直至确定的所述匹配用户满足设定数量条件,完成群组匹配。2.根据权利要求1所述的方法,其特征在于,所述根节点用户的关联用户为在所述第二社交网络平台中与所述根节点用户之间的亲密度不小于设定阈值的用户节点,其中,所述设定阈值根据所述第一用户群组的亲密度而设定。3.根据权利要求2所述的方法,其特征在于,所述以确定的所述匹配用户为当前根节点用户,确定下一个匹配用户,直至确定的所述匹配用户满足设定数量条件,完成群组匹配的步骤为:以确定的所述匹配用户为当前根节点用户,在所述第二社交网络平台中查找所述当前根节点用户的当前关联用户,其中,查找的所述当前关联用户与确定的所有匹配用户和所述指定的根节点组成的群组的群组亲密度不小于设定阈值;在所述当前关联用户中确定下一个匹配用户,直至确定的所述匹配用户满足设定数量条件,完成群组匹配。4.根据权利要求1所述的方法,其特征在于,所述在所述第一社交网络平台标识对应的第一社交网络平台中获取所述第一用户群组对应的群组行为数据,并对所述群组行为数据进行行为学习,得到所述第一用户群组对应的群组特征分布函数的步骤包括:在所述第一社交网络平台标识对应的第一社交网络平台中获取所述第一用户群组对应的群组行为数据;提取所述群组行为数据中的特征词语,根据所述特征词语生成多个特征向量,其中,所述特征向量都是由属于同一类别的特征词语构成的;依次根据所述第一用户群组中每个用户对应的行为数据中出现所述特征词语的频率信息修正每个所述特征向量对应的特征分布值,进而得到所述第一用户群组对应的群组特征分布函数。5.根据权利要求4所述的方法,其特征在于,所述基于所述第一用户群组对应的群组特征分布函数,学习所述根节点用户的行为数据,生成匹配根节点用户后的群组特征...

【专利技术属性】
技术研发人员:王健宗黄章成吴天博肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1