基于用户行为的数据关联方法技术

技术编号:15288438 阅读:109 留言:0更新日期:2017-05-10 13:21
本发明专利技术提供了一种基于用户行为的数据关联方法,其中,该方法包括:获取网站上的用户基本信息、用户历史行为数据集合和待关联数据集合;根据所述用户基本信息和所述用户历史行为数据集合构建用户间关系结构图;根据所述用户间关系结构图度量用户在不同主题下的权威度;将所述权威度与所述待关联数据集合进行融合处理获得数据关联结果。本发明专利技术提供的数据关联方法可以适应于新用户、新数据项,并且可以发现用户的潜在信息需求。

Data association method based on user behavior

The invention provides a data association method based on user behavior, the method includes: obtaining the user basic information, user behavior history data set and the associated data set to construct the graph structure; according to the user basic information the user and the user behavior history data according to the set; the relationship between the structure of users to measure the user in different subject under the authority of the authority; and the associated data fusion for data association results. The data association method provided by the invention can be adapted to new users and new data items, and can discover the potential information needs of users.

【技术实现步骤摘要】

本专利技术涉及计算机领域,尤其涉及一种数据关联方法,具体来说就是一种基于用户行为的数据关联方法
技术介绍
随着电子购物平台及其相关信息技术的飞速发展,电子网络购物已成为人们生活中不可或缺的组成部分。然而网络中信息资源的数量大大超出了人们的处理能力,“网络信息过载”问题日趋严重。因此,新兴电子购物网络在便利人们日常生活的同时,也对现有信息检索、个性化推荐服务、精准营销等数据关联问题带来了巨大的机遇和挑战。因此,为满足用户越来越高的信息服务要求,向用户精准推送感兴趣数据项目的数据关联技术应运而生,并引起了国内外学者和用户的广泛关注。然而,现有数据关联方法存在数据稀疏、数据关联冷启动、精准度不高等缺陷。现有技术中,可将数据关联方法归纳成三个主要类别:基于内容的数据关联方法、协同过滤数据关联方法和混合数据关联方法。其中,基于内容的数据关联方法从内容角度挖掘用户信息需求与数据对象的关联,通过度量用户模型与数据项模型的相似性来实现对备选数据项的关联预测;但由于其没有充分利用用户群体知识,导致其关联的数据项目与用户模型耦合度过于紧密,无法发现用户的潜在信息需求,很难实现具有一定联想功能的数据关联服务。协同过滤数据关联方法的应用前景则更加广泛,其基于群体知识进行数据关联,即兴趣和偏好相似的用户之间可以共享各自的信息体验,通过发现与用户兴趣相似的邻居用户,并将邻居用户感兴趣的数据项与目标用户进行关联;但实际应用中,协同过滤数据关联方法也存在着一些其难以克服的问题或缺陷,例如:当用户无任何数据关联历史,该模型则无法对该新用户的兴趣偏爱进行建模;与此相对应的就是新数据项问题,当出现新的数据项时,很少甚至没有用户与其发生过关联,进而导致关联算法无法实现相似度计算和关联度预测。如上所述,基于内容的数据关联方法和协同过滤数据关联方法都是通过单一的、各不相同的关联策略来实现信息与用户的关联服务,其优缺点各有不同。基于此,本领域技术人员提出并尝试将上述两种关联方法通过不同形式进行组合,进而也就形成了基于多种关联策略和机制的混合数据关联方法,然而实践证明混合数据关联方法仍存在数据稀疏、数据关联冷启动、精准度不高等不足。因此,本领域技术人员亟待研发出一种能够适应于新用户、新数据项,匹配精准度高,并且能够发现用户潜在信息需求的数据关联方法。
技术实现思路
有鉴于此,本专利技术要解决的技术问题在于提供一种基于用户行为的数据关联方法及装置,解决了现有数据关联方法存在数据稀疏、数据关联冷启动、匹配精准度不高等问题。为了解决上述技术问题,本专利技术的具体实施方式提供一种基于用户行为的数据关联方法,包括:获取网站上的用户基本信息、用户历史行为数据集合和待关联数据集合;根据所述用户基本信息和所述用户历史行为数据集合构建用户间关系结构图;根据所述用户间关系结构图度量用户在不同主题下的权威度;将所述权威度与所述待关联数据集合进行融合处理获得数据关联结果。根据本专利技术的上述具体实施方式可知,基于用户行为的数据关联方法至少具有以下有益效果或特点:深化分析用户的历史行为数据,构建用户兴趣画像模型;通过对多个用户间不同主题下的关联度分析,构建可精准描述用户间关系谱系结构的面向主题的加权网络拓扑结构;结合加权网络拓扑结构与用户间历史行为数据的关联性,提出Urank算法,用以计算用户在多个不同主题下的权威度与影响力,进而提升基于用户行为的数据关联精准度,可以适应于新用户、新数据项,并且可以发现用户的潜在信息需求,提高用户体验度。应了解的是,上述一般描述及以下具体实施方式仅为示例性及阐释性的,其并不能限制本专利技术所欲主张的范围。附图说明下面的所附附图是本专利技术的说明书的一部分,其绘示了本专利技术的示例实施例,所附附图与说明书的描述一起用来说明本专利技术的原理。图1为本专利技术具体实施方式提供的一种基于用户行为的数据关联方法的实施例一的流程图;图2为本专利技术具体实施方式提供的一种基于用户行为的数据关联方法的实施例二的流程图;图3为本专利技术具体实施方式提供的一种基于用户行为的数据关联方法的实施例三的流程图;图4为本专利技术具体实施方式提供的一种基于用户行为的数据关联系统的示意框图;图5为本专利技术具体实施方式提供的一种具体用户间面向不同主题维度的关联度评估图模型;图6为本专利技术具体实施方式提供的一种面向不同主题维度的用户影响力计算示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚明白,下面将以附图及详细叙述清楚说明本专利技术所揭示内容的精神,任何所属
技术人员在了解本
技术实现思路
的实施例后,当可由本
技术实现思路
所教示的技术,加以改变及修饰,其并不脱离本
技术实现思路
的精神与范围。本专利技术的示意性实施例及其说明用于解释本专利技术,但并不作为对本专利技术的限定。另外,在附图及实施方式中所使用相同或类似标号的元件/构件是用来代表相同或类似部分。关于本文中所使用的“第一”、“第二”、…等,并非特别指称次序或顺位的意思,也非用以限定本专利技术,其仅为了区别以相同技术用语描述的元件或操作。关于本文中所使用的方向用语,例如:上、下、左、右、前或后等,仅是参考附图的方向。因此,使用的方向用语是用来说明并非用来限制本创作。关于本文中所使用的“包含”、“包括”、“具有”、“含有”等等,均为开放性的用语,即意指包含但不限于。关于本文中所使用的“及/或”,包括所述事物的任一或全部组合。关于本文中所使用的用语“大致”、“约”等,用以修饰任何可以微变化的数量或误差,但这些微变化或误差并不会改变其本质。一般而言,此类用语所修饰的微变化或误差的范围在部分实施例中可为20%,在部分实施例中可为10%,在部分实施例中可为5%或是其他数值。本领域技术人员应当了解,前述提及的数值可依实际需求而调整,并不以此为限。某些用以描述本申请的用词将于下或在此说明书的别处讨论,以提供本领域技术人员在有关本申请的描述上额外的引导。图1为本专利技术具体实施方式提供的一种基于用户行为的数据关联方法的实施例一的流程图,如图1所示,利用网站上的用户基本信息和用户历史行为数据集合构建用户间关系结构图,再根据用户间关系结构图度量用户在不同主题下的权威度,从而将权威度与待关联数据集合进行融合处理获得数据关联结果。该附图所示的具体实施方式包括:步骤101:获取网站上的用户基本信息、用户历史行为数据集合和待关联数据集合。其中,用户基本信息包括:年龄、性别、职业、所在城市、兴趣爱好等;用户历史行为数据集合包括用户历史购买行为、用户电子商务网站浏览与评论行为等;待关联数据集合为电子商务网站商品集(或电子商务网站商品子集)。步骤102:根据所述用户基本信息和所述用户历史行为数据集合构建用户间关系结构图。用户间关系结构图为面向主题维度的关联度评估图模型。基于所构建的用户间关系结构图,可以有效计算客户不同主题维度下的权威度,以提升数据关联效果。步骤103:根据所述用户间关系结构图度量用户在不同主题下的权威度。利用URank算法根据用户间关系结构图度量用户在不同主题下的权威度。步骤104:将所述权威度与所述待关联数据集合进行融合处理获得数据关联结果。参见图1,深化分析用户的历史行为数据,构建用户兴趣画像模型;通过对多个用户间不同主题下的关联度分析,构建可精准描述用户间关系谱系结构的面向主题的加本文档来自技高网
...
基于用户行为的数据关联方法

【技术保护点】
一种基于用户行为的数据关联方法,其特征在于,该方法包括:获取网站上的用户基本信息、用户历史行为数据集合和待关联数据集合;根据所述用户基本信息和所述用户历史行为数据集合构建用户间关系结构图;根据所述用户间关系结构图度量用户在不同主题下的权威度;以及将所述权威度与所述待关联数据集合进行融合处理获得数据关联结果。

【技术特征摘要】
1.一种基于用户行为的数据关联方法,其特征在于,该方法包括:获取网站上的用户基本信息、用户历史行为数据集合和待关联数据集合;根据所述用户基本信息和所述用户历史行为数据集合构建用户间关系结构图;根据所述用户间关系结构图度量用户在不同主题下的权威度;以及将所述权威度与所述待关联数据集合进行融合处理获得数据关联结果。2.如权利要求1所述的基于用户行为的数据关联方法,其特征在于,根据所述用户基本信息和所述用户历史行为数据集合构建用户间关系结构图的步骤之前,该方法还包括:根据所述用户基本信息和所述用户历史行为数据集合进行用户兴趣画像。3.如权利要求2所述的基于用户行为的数据关联方法,其特征在于,根据所述用户基本信息和所述用户历史行为数据集合进行用户兴趣画像的步骤,具体包括:根据所述用户基本信息中的具体用户uk确定该具体用户uk对应的历史行为数据集合V;计算所述待关联数据集合中的待关联数据项vh与历史行为数据集合V之间的相似度;根据所述相似度获得具体用户uk对待关联数据项vh的兴趣度I(vh,uk);以及根据所述兴趣度I(vh,uk)进行用户兴趣画像。4.如权利要求3所述的基于用户行为的数据关联方法,其特征在于,所述兴趣度I(vh,uk)的具体计算公式为:I(vh,uk)=Σt=1TwtΣo=1Hμt(vo,uk)St(vh,vo)]]>其中,t为相似度计算维度;T为相似度计算维度总数;wt为维度权重因子;vo为用户历史行为数据项;μt(vo,uk)为具体用户uk对其历史行为数据项vo的兴趣偏好;St(vh,vo)为待关联数据项vh与用户历史行为数据项vo在相似度计算维度t下的相似性。5.如权利要求1所述的基于用户行为的数据关联方法,其特征在于,根据所述用户基本信息和所述用户历史行为数据集合构建用户间关系结构图的步骤,具体包括:根据所述用户基本信息获取具体用户ui和具体用户uj之间的基本信息相似度S(ij);根据所述基本信息相似度S(ij)获取具体用户ui和具体用户uj在特定主题维度Al下的关联度Tl(ij);获取具体用户ui的历史行为数据集合和具体用户uj的历史行为数据集合在特定主题维度Al下的关联紧密程度以及根据所述关联度Tl(ij)和所述关联紧密程度构建用户间关系结构图。6.如权利要求5所述的基于用户行为的数据关联方法,其特征在于,基本信息相似度S(ij)的表达式为:S(ij)=(s1(ij),s2(ij),...,sP(ij))]]>其中,为对应基...

【专利技术属性】
技术研发人员:赵小建胥克良胡凯乐刘意
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1