针对两微一端跨信源账号推荐方法技术

技术编号:19634997 阅读:45 留言:0更新日期:2018-12-01 15:44
本发明专利技术公开了一种针对两微一端跨信源账号推荐方法,包括:将两微一端跨信源账号关联度衡量指标分为三级,包括多个一级关联度衡量指标,各个一级指标下分多个二级指标,以及各二级指标对应的各维度数据字段为三级指标;确定种子账户和多个目标账户;采集三级指标下的各维度数据,量化各个维度数据的相似度;基于用户关注度需求确定一级指标权重和一级指标下各个二级指标的权重;将所得各类三级关联度衡量指标下各个维度数据相似度与各自权重加权求和,获得各目标账号关联度指数,并将这些目标账户关联度指数倒序推荐。本发明专利技术所述推荐方法可跨信源进行账号推荐,且推荐结果精确合理。

Recommendation method for cross-source accounts with two micro-terminals

The invention discloses a recommendation method for two micro-one-end cross-source accounts, which includes: dividing two micro-one-end cross-source account association degree measurement index into three levels, including multiple first-level association degree measurement index, multiple second-level indicators under each first-level indicator, and three-level indicators corresponding to each dimension data field of each second-level indicator. Standard; determine seed account and multiple target accounts; collect dimension data under three-level indicators to quantify the similarity of dimension data; determine the weights of first-level indicators and second-level indicators under one-level indicators based on user's attention needs; and measure the similarity of dimension data under all three-level indicators. The weighted sum of the degree and the respective weights is used to obtain the target account correlation index and recommend the target account correlation index in reverse order. The recommendation method of the invention can recommend accounts across sources, and the recommendation result is accurate and reasonable.

【技术实现步骤摘要】
针对两微一端跨信源账号推荐方法
本专利技术涉及互联网应用
更具体地说,本专利技术涉及一种针对两微一端跨信源账号推荐方法。
技术介绍
随着移动网络的普及,微博、微信、新闻客户端(以下简称:两微一端)覆盖人群日益增多,社交媒体正成为网络社会热点事件产生和发酵的源头,往往在形成传播影响力后带动新闻网站、传统媒体跟进报道。然而,为了吸引网民关注,两微一端中不乏存在低级趣味、极端思想、自由思潮等信息以及为博眼球的不实谣言。更有国内外势力团队利用自媒体进行网络渗透,恶意散布蛊惑人心、煽风点火的言论,为意识形态工作带来巨大挑战,甚至可能对社会稳定带来影响。因此,迫切需要建立面向移动互联网的信息监测预警和态势感知能力。目前两微一端账号监测是针对两微一端信息监测预警工作中的重要组成部分,但是工作掌握的监测目标账号往往不能覆盖面向移动互联网的信息监测预警的需求。一些势力利用大量跨平台的小号、马甲账号不断躲避官方的监管,积极主动发现可能与已掌握账号有关联的两微一端账号,扩大业务重点关注范围,提前监测、提前预警成为了自媒体迅猛发展时代下移动互联网信息监测预警工作的新需求。目前通过已知账号推荐相关账号方法主要针对微博单一信源,且推荐方法多采用关注关系信息进行推荐,或通过用户注册信息进行推荐,例如通讯录信息、注册账号时填写的学校、工作信息等。这些账号推荐方法存在推荐结果考虑因素单一的问题,一些用户关心的账号信息往往因为粉丝量少、发博量少等原因排于大V账号之后。
技术实现思路
本专利技术的一个目的是解决至少上述问题,并提供至少后面将说明的优点。本专利技术还有一个目的是提供一种针对两微一端平台跨信源账号推荐方法,所述方法不止针对单一信源,跨信源基于多维关联度衡量指标,使账号推荐结果更加精确合理。为了实现根据本专利技术的这些目的和其它优点,提供了一种针对两微一端跨信源账号推荐方法,包括:将两微一端跨信源账号关联度衡量指标分为三级,包括多个一级关联度衡量指标,各个一级指标下分多个二级指标,以及各二级指标对应的各维度数据字段为三级指标;确定种子账户和多个目标账户;采集三级指标下的各维度数据,量化各个目标账号维度数据的相似度;基于用户关注度需求确定一级指标权重和一级指标下各个二级指标的权重,各个同族一级指标的权重和为1,同一个一级指标下的各个同族二级指标的权重和为1;将所得各类三级关联度衡量指标下各个维度数据相似度与各自权重加权求和,获得各目标账号关联度指数,并将这些目标账户关联度指数倒序推荐。优选的是,所述一级关联度衡量指标包括:主体关联度、基础关联度、交互关联度、社交关联度以及内容关联度指标;所述主体关联度一级指标下包括认证主体关联二级指标,其对应的微博、微信以及APP三级指标分别为认证主体、账号主体以及应用开发商;所述基础关联度一级指标下包括账号名称关联、账号简介关联、联系方式关联、账号地域关联、账号标签关联二级指标,所述账号名称关联二级指标对应的微博、微信以及APP三级指标分别为用户昵称、用户昵称以及APP站点名称指标,所述账号简介关联二级指标对应的微博、微信以及APP三级指标分别为个人描述、功能简介以及软件介绍,所述联系方式关联二级指标对应的微博和微信三级指标分别为联系电话和客服电话指标,所述账号地域关联二级指标对应的微博三级指标为所在地,所述账号标签关联二级指标对应的微博和APP三级指标分别为标签和应用类别指标;所述交互关联度一级指标下包括评论行为关联、转发行为关联以及点赞行为关联二级指标,所述评论行为关联二级指标对应的微博三级指标为评论行为,所述转发行为关联二级指标对应的微博、微信以及APP三级指标分别为转发行为、文章转载源以及新闻转载源指标,所述点赞行为关联二级指标对应的微博三级指标为点赞行为指标;所述社交关联度一级指标下包括关注关系关联、粉丝关系关联、共同关注关联、共同粉丝关联、账号推荐关联二级指标,所述关注关系关联、粉丝关系关联、共同关注关联以及共同粉丝关联二级指标对应的微博三级指标分别为关注列表、粉丝列表、共同关注以及共同粉丝指标,所述账号推荐关联二级指标对应的微博和微信三级指标分别为友情链接指标和文章信息中推荐其他账号行为指标;所述内容关联度一级指标下包括信息标题关联、发布时间关联、信息内容关联以及链接地址关联二级指标,所述信息标题关联二级指标对应的微博、微信以及APP三级指标分别为长微博标题、文章标题以及新闻标题指标指标,所述发布时间关联二级指标对应的微博、微信以及APP三级指标都为发布时间指标,所述信息内容关联二级指标对应的微博、微信以及APP三级指标分别为博文内容、文章内容以及新闻内容,所述链接地址关联二级指标对应的微博、微信以及APP三级指标分别为博文包含链接、文章包含链接以及新闻包含链接指标。优选的是,所述用户基于关注度需求确定一级指标权重和一级指标下各个二级指标的权重时,部分指标权重缺失时,将所述缺失指标的权重平均分给同族剩余权重。优选的是,量化各个维度数据的相似度前还包括将种子账户和目标账户各个维度数据的字段数据对齐。优选的是,所述各个维度数据相似度的量化计算中文本相似度通过word2vec方式先得到词的向量化表示,再计算得到文本相似度;发布时间相似度计算方式为:与种子账号发布时间相差1h以内的,相似度为1,1h以上6h以内的相似度为0.75,6h以上12h以内的相似度为0.5,12h以上24h以内的相似度为0.25,24h以上的相似度为0。优选的是,所述采集三级指标下的各维度数据为最近一个月的相关数据。优选的是,所述微博三级指标下的各维度数据可以通过网页采集和OpenAPI采集相结合的方式采集相关数据;微信三级指标下的各维度数据可以通过微信网页版采集微信公众号的相关数据;APP三级指标下的各维度数据可以通过安卓应用商店页面采集以及抓包工具采集新闻APP的相关数据。优选的是,所述微博标签三级指标相似度等于种子账号与目标账号相同标签数/目标账号总标签数;所述微博评论行为、转发以及点赞三级指标相似度分别等于目标账号评论种子账号的信息数/目标账号总评论数、目标账号转发种子账号的信息数/目标账号总转发数以及目标账号点赞种子账号的信息数/目标账号总点赞数。优选的是,所述微信文章转载源三级指标相似度等于目标账号文章转载自种子账号信息数/目标账号文章总数。优选的是,所述APP应用类别三级指标相似度等于目标账号的应用类别与种子账号标签或者应用类别相同数/目标账号总应用类别数;所述APP新闻转载源三级指标的相似度等于目标APP转载自种子账号的信息数/目标APP总信息数。本专利技术至少包括以下有益效果:其一,本专利技术所提供的账号推荐方法不止是针对单一信源的账号推荐方法,其可以做到跨信源进行账号推荐;其二,本专利技术所提供的账号推荐方法基于主体关联度、基础关联度、交互关联度、社交关联度、内容关联度等多维关联度衡量指标,使账号推荐结果更加精确合理,账号推荐结果一目了然。本专利技术的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本专利技术的研究和实践而为本领域的技术人员所理解。附图说明图1为本专利技术所述针对两微一端跨信源账号推荐方法的流程图。具体实施方式下面结合附图对本专利技术做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施本文档来自技高网...

【技术保护点】
1.一种针对两微一端跨信源账号推荐方法,其特征在于,包括:将两微一端跨信源账号关联度衡量指标分为三级,包括多个一级关联度衡量指标,各个一级指标下分多个二级指标,以及各二级指标对应的各维度数据字段为三级指标;确定种子账户和多个目标账户;采集三级指标下的各维度数据,量化各个目标账号维度数据的相似度;基于用户关注度需求确定一级指标权重和一级指标下各个二级指标的权重,各个同族一级指标的权重和为1,同一个一级指标下的各个同族二级指标的权重和为1;将所得各类三级关联度衡量指标下各个维度数据相似度与各自权重加权求和,获得各目标账号关联度指数,并将这些目标账户关联度指数倒序推荐。

【技术特征摘要】
1.一种针对两微一端跨信源账号推荐方法,其特征在于,包括:将两微一端跨信源账号关联度衡量指标分为三级,包括多个一级关联度衡量指标,各个一级指标下分多个二级指标,以及各二级指标对应的各维度数据字段为三级指标;确定种子账户和多个目标账户;采集三级指标下的各维度数据,量化各个目标账号维度数据的相似度;基于用户关注度需求确定一级指标权重和一级指标下各个二级指标的权重,各个同族一级指标的权重和为1,同一个一级指标下的各个同族二级指标的权重和为1;将所得各类三级关联度衡量指标下各个维度数据相似度与各自权重加权求和,获得各目标账号关联度指数,并将这些目标账户关联度指数倒序推荐。2.如权利要求1所述的针对两微一端跨信源账号推荐方法,其特征在于,所述一级关联度衡量指标包括:主体关联度、基础关联度、交互关联度、社交关联度以及内容关联度指标;所述主体关联度一级指标下包括认证主体关联二级指标,其对应的微博、微信以及APP三级指标分别为认证主体、账号主体以及应用开发商;所述基础关联度一级指标下包括账号名称关联、账号简介关联、联系方式关联、账号地域关联、账号标签关联二级指标,所述账号名称关联二级指标对应的微博、微信以及APP三级指标分别为用户昵称、用户昵称以及APP站点名称指标,所述账号简介关联二级指标对应的微博、微信以及APP三级指标分别为个人描述、功能简介以及软件介绍,所述联系方式关联二级指标对应的微博和微信三级指标分别为联系电话和客服电话指标,所述账号地域关联二级指标对应的微博三级指标为所在地,所述账号标签关联二级指标对应的微博和APP三级指标分别为标签和应用类别指标;所述交互关联度一级指标下包括评论行为关联、转发行为关联以及点赞行为关联二级指标,所述评论行为关联二级指标对应的微博三级指标为评论行为,所述转发行为关联二级指标对应的微博、微信以及APP三级指标分别为转发行为、文章转载源以及新闻转载源指标,所述点赞行为关联二级指标对应的微博三级指标为点赞行为指标;所述社交关联度一级指标下包括关注关系关联、粉丝关系关联、共同关注关联、共同粉丝关联、账号推荐关联二级指标,所述关注关系关联、粉丝关系关联、共同关注关联以及共同粉丝关联二级指标对应的微博三级指标分别为关注列表、粉丝列表、共同关注以及共同粉丝指标,所述账号推荐关联二级指标对应的微博和微信三级指标分别为友情链接指标和文章信息中推荐其他账号行为指标;所述内容关联度一级指标下包括信息标题关联、发布时间关联、信息内容关联以及链接地址关联二级指标,所述信息标题关联二级指标对应的微博、微信以及APP三级指标分别为长微博标题、文章标题以及新闻标题指标指标,所述发布...

【专利技术属性】
技术研发人员:张旭刘春阳李雄王慧王臻
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1