当前位置: 首页 > 专利查询>景祝强专利>正文

一种获取用户个性化特征的系统技术方案

技术编号:20363386 阅读:28 留言:0更新日期:2019-02-16 16:45
本发明专利技术提出了一种获取用户个性化特征的方法和系统。所述方法通过用户访问用户的信号以及用户访问文档的信号,来自动地更新用户的个性化特征。用户的个性化特征,既可以依据所述用户访问过的其他用户的个性化特征进行更新,也可以依据用户访问过的文档的个性化特征进行更新。根据查询用户提交的查询条件和一组用户中的每个用户的个性化特征,计算所述一组用户中每个用户的个性化排序值,以及按照所述个性化排序值的大小,将所述一组用户中的至少一个用户的标识发送给查询用户。本发明专利技术还提出了一种获取用户个性化特征的系统。本发明专利技术方法可用于在社交网络中查找具有特定特征的用户或者用户群。

【技术实现步骤摘要】
一种获取用户个性化特征的系统本申请是申请日为2012年5月8日,申请号为201210152084.1,专利技术名称为“一种获取用户个性化特征的方法和系统”的专利的分案申请。
本专利技术涉及互联网领域,具体来说涉及一种获取用户个性化特征的方法和系统。
技术介绍
早期互联网的主要入口是门户网站,用户通过网站工作人员手工编辑的网页来进入网络世界。随后由于搜索技术的发展,人们开始使用搜索引擎作为互联网的主要入口,用户通过输入搜索关键字就可以方便地在互联网上检索信息。近几年,随着脸谱(Facebook)、推特(Twitter)、Google+和微博等应用的快速发展,社交网络正在逐渐成为互联网的主要入口。在社交网络上,用户主要通过自己建立的关系网络来过滤和筛选互联网信息。例如用户通过加关注(follow)获得被关注人发布或转发的信息、通过加好友来获取好友发布的信息等。研究表明,在社交网络上用户建立的关系网络主要包括用户的家人、朋友和同事等“强关系”网络,本质上这是用户线下实体关系网络在线上的复制。而社交网络真正的潜力在于开发用户目前还不认识的那些“弱关系”用户资源,例如网络上的领域专家、名师、达人等等。目前,在社交网络上建立“弱关系”网络的方法还比较单一,用户容易找到那些知名度较高或者粉丝数较多的少数人,却很难发现那些在某个特定专业领域有一技之长或者对于某个特定主题感兴趣的大多数人。这是现有社交网络技术的缺点。一种改进方案是在社交网络上为每个用户设置个性化特征,然后根据所述用户的个性化特征来寻找具有特定特征的用户或者用户群,并将他们加入到用户自己的关系网络中来。但是,在社交网络上获取用户的个性化特征是比较困难的,主要有以下几个难点。第一是个性化信息的自动获取问题。目前脸谱上有9亿用户,新浪微博有1.4亿用户,如果要求多数用户在社交网络上手工维护其个性化特征是不现实的。如何自动获取用户的个性化特征是一个难题。第二是个性化信息的更新问题。随着时间的推移,用户的兴趣爱好、工作地点、从事的行业和教育程度等个人信息会发生改变,但是要求多数用户实时地更新其个性化信息是困难的。第三是个性化信息的语义差异问题。在用户设置的个性化特征中,术语不同但语义相同的个性化特征,难以对它们进行归类。第四是个性化信息的完备性问题。用户在网站上提供的个人信息通常比较简略。例如用户在兴趣爱好一项的典型描述是喜欢音乐、打棒球或看书等几项内容,而要求用户全面地细致地描述出其感兴趣的领域是繁琐和困难的。综上所述,如何有效地获取用户的个性化特征,并根据所述个性化特征在社交网络中查找具有特定特征的用户和用户群,是一个需要解决的问题。
技术实现思路
鉴于上述现有技术存在的问题,本专利技术的目的在于提供一种获取用户个性化特征的方法和系统,来自动获取用户的个性化特征,进而根据所述个性化特征,在社交网络中查找具有特定特征的用户和用户群。根据以上所述的目的,本专利技术提出了一种获取用户个性化特征的方法,其特征在于,在互联网上获取多个用户,存储由所述多个用户组成的用户集U={1,2,...,M};设置多个特征,存储由所述多个特征组成的特征集K={1,2,...,L};为所述用户集U中的多个用户设置参数向量初始值;多次执行如下步骤:接收任意一个用户i(i∈U)访问任意一个用户j(j∈U)的信号;读取所述用户i的参数向量Ku(i)=(uwi1,uwi2,...,uwik,...,uwiL),所述uwik表示所述用户i与特征k(k∈K)的相关度;读取所述用户j的参数向量Ku(j)=(uwj1,uwj2,...,uwjk,...,uwjL),所述uwjk表示所述用户j与特征k(k∈K)的相关度;用如下参数向量更新算法,来更新所述用户i和所述用户j的参数向量;Ku*(i)=function1[Ku(i),Ku(j)];Ku*(j)=function2[Ku(i),Ku(j)];其中,所述Ku(i)和所述Ku*(i)分别表示更新前和更新后所述用户i的参数向量,所述Ku(j)和所述Ku*(j)分别表示更新前和更新后所述用户j的参数向量。与现有技术相比,本专利技术方法以用户的参数向量来反映用户的个性化特征,通过参数向量更新算法,解决了用户个性化特征的自动获取、实时更新等问题,并且能够根据所述用户的参数向量,在社交网络中查找具有特定特征的用户和用户群,为用户建立“弱关系”网络提供了一个新的途径。附图说明图1为用户集U中每个用户的参数向量表示方法;图2为文档集D中每个文档的参数向量表示方法;图3为基于用户访问用户信号的获取用户个性化特征的方法;图4为基于用户访问文档信号的获取用户个性化特征的方法;图5为查询具有特定特征的用户的方法流程图;图6为查询具有特定特征的用户群的方法流程图;图7为一种获取用户个性化特征的系统结构图。具体实施方式结合附图对本专利技术方法作进一步详细说明。对本专利方法具体实施方案的说明,包括以下几个部分。首先,说明用户、文档和特征的编号方法,以及用户和文档的参数向量表示方法;然后,说明基于用户访问用户信号的参数向量更新算法,以及基于用户访问文档信号的参数向量更新算法;之后,说明在社交网络上按照给定特征查找用户或用户群的方法;最后,说明一种获取用户个性化特征的系统。首先说明用户、文档和特征的编号方法。在互联网上获取多个用户,每个用户拥有至少一个用户标识,所述用户标识包括用户帐号、手机号码、Cookie识别码、IP地址、Email地址和即时通信号码中的一个。对获取的多个用户进行统一编号,并将用户编号汇集在一起组成用户集U={1,2,...,M},其中M为用户个数,每个用户有唯一的用户编码。同样,在互联网上获取多个文档,例如通过蜘蛛程序获取多个Web网页。互联网上的文档,具有唯一标识,例如Web网页的URL地址。对获取的多个文档进行统一编号,并将文档编号汇集在一起组成文档集D={1,2,...,N},其中N为文档个数,每个文档有唯一的文档编码。将所述用户集U和所述文档集D中的每个元素所具有的特征进行统一编号,组成特征集K={1,2,...,L},其中L为特征个数。所述特征表示用户和文档的属性,例如新闻、财经、科学、音乐、军事和体育等等。下面介绍用户和文档的参数向量的表示方法。所述参数向量表示方法与向量空间模型VSM的向量表述方法相似,即以特征项作为用户特征或文档特征的基本单位。用用户与各个特征的相关度的集合来表示用户的参数向量,用文档与各个特征的相关度的集合来表示文档的参数向量。如果某个用户或者文档不具有某个特征,则用户或者文档与该特征的相关度为零。图1为用户集U中每个用户的参数向量表示方法。在用户集U中任意一个用户i(i∈U)的参数向量设置为Ku(i)=(uwi1,uwi2,...,uwik,...,uwiL),其中所述uwik表示所述用户i与特征k(k∈K)的相关度,uwik∈[a,b],a和b为非负常数。另外,将所述用户集U中的每个用户与特征集K的第k个特征的相关度汇集在一起组成一个向量,叫做用户集U的第k个用户列向量(uw1k,uw2k,...,uwMk)。图2为文档集D中每个文档的参数向量表示方法。在文档集D中任意一个文档n(n∈D)的参数向量设置为Kd(n)=(dwn1,dw本文档来自技高网
...

【技术保护点】
1.一种获取用户个性化特征的系统,其特征在于,所述系统包括:用户、文档和特征设置模块:在互联网上获取多个用户,组成用户集U={1,2,...,M},将所述用户集U存储于用户数据库中;在互联网上获取多个文档,组成文档集D={1,2,...,N},将所述文档集D存储于文档数据库中;设置多个特征,组成特征集K={1,2,...,L},将所述特征集K存储于特征数据库中;用户和文档的参数向量初始值设置模块:为所述用户集U中的多个用户设置参数向量初始值,并将其存储于所述用户数据库;为所述文档集D中的多个文档设置参数向量初始值,并将其存储于所述文档数据库;未被设置参数向量初始值的用户和文档,其参数向量初始值缺省设为零向量;用户访问用户信号采集模块:用于采集任意一个用户i(i∈U)访问任意一个用户j(j∈U)的信号1,所述信号1存储于Web日志数据库中;用户访问文档信号采集模块:用于采集任意一个用户m(m∈U)访问任意一个文档n(n∈D)的信号2,所述信号2存储于Web日志数据库中;用户的参数向量更新模块:根据所述信号1,在所述用户数据库中读取所述用户i和所述用户j的参数向量,然后通过参数向量更新算法更新所述用户i和所述用户j的参数向量;根据所述信号2,在所述用户数据库中读取所述用户m的参数向量以及在所述文档数据库中读取所述文档n的参数向量,然后通过参数向量更新算法2,更新所述用户m和所述文档n的参数向量;用户查询模块:该模块具有用户和用户群的查询功能;用户查询功能包括:接收由查询用户设置的查询向量并且获取一组用户...

【技术特征摘要】
1.一种获取用户个性化特征的系统,其特征在于,所述系统包括:用户、文档和特征设置模块:在互联网上获取多个用户,组成用户集U={1,2,...,M},将所述用户集U存储于用户数据库中;在互联网上获取多个文档,组成文档集D={1,2,...,N},将所述文档集D存储于文档数据库中;设置多个特征,组成特征集K={1,2,...,L},将所述特征集K存储于特征数据库中;用户和文档的参数向量初始值设置模块:为所述用户集U中的多个用户设置参数向量初始值,并将其存储于所述用户数据库;为所述文档集D中的多个文档设置参数向量初始值,并将其存储于所述文档数据库;未被设置参数向量初始值的用户和文档,其参数向量初始值缺省设为零向量;用户访问用户信号采集模块:用于采集任意一个用户i(i∈U)访问任意一个用户j(j∈U)的信号1,所述信号1存储于Web日志数据库中;用户访问文档信号采集模块:用于采集任意一个用户m(m∈U)访问任意一个文档n(n∈D)的信号2,所述信号2存...

【专利技术属性】
技术研发人员:祁勇
申请(专利权)人:景祝强
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1