一种公众号的健康度排序方法及其排序系统技术方案

技术编号:14583295 阅读:61 留言:0更新日期:2017-02-08 13:19
本发明专利技术提供了一种公众号的健康度排序方法及其排序系统,其方法包括:收集多个公众号在第一时间段内各自发布的所有公众号信息的总数量F、每条公众号信息的间隔时间B(N)、间隔时间的平均值A、标准差V、平均影响力S、以及最后一次发布公众号信息与观测日期的间隔天数T;当公众号在第一时间段内发布的公众号信息的总数量F等于1时,健康度参考值E=S/exp(T)*exp(A)*10000;当公众号在第一时间段内发布的公众号信息的总数量F大于1时,健康度参考值E=S/exp(T)*exp(A)*exp(V);以及对健康度参考值E作数据0‑1标准化,并乘以100,映射到[0,100]内的帐号健康度G。

【技术实现步骤摘要】

本专利技术涉及网络信息处理,尤其涉及一种公众号的健康度排序方法及其排序系统。
技术介绍
随着社交网络及大数据时代的迅速发展,越来越多的社交网络将用户进行区分。以微信为例,除了一般用户可注册的一般账号,其还设置公众号账号供用户进行注册。注册一般账号的用户通常以该账号作为个人的联络、通讯及分享来使用。一般账号可在一对一、或群组的聊天场景中,发送聊天信息,聊天信息可以是文字、图片、音频或视频。然而,聊天信息由于其实时性、交互频率快等特点,通常不会使用文字、图片、音频或视频的组合信息。同时,一般账号仅能在朋友圈(社交网络交互场景)发布共享信息,共享信息可以同时被该一般账号的所有“好友”,或可选地部分“好友”所看到。一般账号所发布的共享信息可以是文字、图片及小视频,其文字字数、图片数量及小视频的数量都有限制。而个人、组织或者公司可注册公众号账号,来直接向其他用户发布公众号信息,公众号信息一般可发布在上述一对一聊天场景中,公众号信息也可以发布在朋友圈(社交网络交互场景)中。公众号信息可以是文本、图片、音频、视频或者他们的组合。同时,公众号信息的文本不限字数、图片、音频及视频不限数量。由此可见,一般账号用于进行社交行动,一般账号的交互对象是注册该一般账号的用户的好友、家人等。而公众号账号则用于推广、传播等,公众号账号的交互对象可以是任何关注该公众号账号的人。本文中所述的公众号账号也可以至其他社交网络中的一些账号类型。例如,公众号账号也可以指微博中的加“V”账号。然而,用户如何选取公众号账号来关注,内容提供者如何选取公众号账号来发布内容,通常都是根据公众号账号的几个维度的评估值来进行选取。这几个维度可以包括公众号账号发布公众号信息的活跃度、公众号信息的影响力、公众号账号的影响力等。由于显示网络状态中存在灌水、刷票等恶劣行为,现有技术无法综合考虑账号所发文章的平均影响力、发表文章的间隔时间及其稳定性,来考虑账号的健康度。
技术实现思路
本专利技术的目的在于提供一种公众号的健康度排序方法及其排序系统,克服了现有技术的困难,能有效准确地通过基于多个数据的排序计算获得总和反应账号所发文章的平均影响力、发表文章的间隔时间及其稳定性的账号健康度。根据本专利技术的一个方面,提供一种公众号的健康度排序方法,包括:收集多个公众号在第一时间段内各自发布的所有公众号信息的总数量F、每条所述公众号信息的间隔时间B(N)、全部所述公众号信息的间隔时间的平均值A、间隔时间的标准差V、平均影响力S、以及最后一次发布所述公众号信息与观测日期的间隔天数T;其中,每条所述公众号信息与在第一时间段内的第一天的间隔天数作为每条所述公众号信息的间隔时间B(N),总数量F、间隔时间B(N)和间隔天数T都属于大于0的整数;当所述公众号在第一时间段内发布的所述公众号信息的总数量F等于1时,健康度参考值E=S/exp(T)*exp(A)*10000;当所述公众号在第一时间段内发布的所述公众号信息的总数量F大于1时,健康度参考值E=S/exp(T)*exp(A)*exp(V);以及对所述健康度参考值E作数据0-1标准化,并乘以100,映射到[0,100]内的帐号健康度G,G属于[0,100]内的有理数。优选地,所述第一时间段是最近一个月的时间跨度。优选地,所述公众号帐号的健康度G=100*[该帐号健康度值–min(所有帐号健康度值)]/[max(所有帐号健康度值)–min(所有帐号健康度值)]。优选地,获得所有公众号信息的平均影响力S包括以下步骤:抓取对应多个公众号信息的第一互动参数Y和第二互动参数D;基于所述公众号信息的第一互动参数Y和第二互动参数D,按下述步骤计算所述公众号信息的影响力W:当所述公众号信息的第一互动参数Y大于等于第一阈值时,计算所述公众号信息的修正第二互动参数:Dm(DT)=exp[1/(DT+1)]*D(DT),其中,DT为所述公众号信息的第一互动参数达到所述第一阈值的日期与当前日期之间的间隔天数,Dm(DT)为公众号信息的当前日期的修正第二互动参数,D(DT)为当前日期的公众号信息的第二互动参数;当DT大于0时,按如下公式计算公众号信息的影响力W:W=aY(DT)+(1-a)[Dm(DT)+Dm(DT-1)-D(DT-1)],其中,a为有理数,Y(DT)为公众号信息的当前日期的第一互动参数,Dm(DT-1)为当前日期前一天的公众号信息的修正第二互动参数,D(DT-1)为当前日期前一天的公众号信息的第二互动参数;最后,按如下公式计算公众号信息的平均响力S:S=W/F。优选地,当所述公众号信息的第一互动参数Y小于所述第一阈值时,按如下公式计算公众号信息的影响力W:W=aY+(1-a)D。优选地,当为DT等于0时,按如下公式计算公众号信息的影响力W:W=aY(0)+(1-a)[Dm(0)],其中,Y(0)为所述公众号信息的当前第一互动参数,Dm(0)为所述公众号信息的当前修正第二互动参数,其中,Dm(0)=exp(1)*D(0),D(0)为所述公众号信息的当前第二互动参数。优选地,所述第一阈值为9000至11000中的整数。优选地,还包括:按照所述公众号的健康度G对公众号进行排序;按照所述公众号的健康度G的排序结果将所述公众号向用户推送。优选地,按照排序结果向用户推送所述公众号的步骤包括:将健康度G排在前R%的公众号推送给用户,R为0至30中的整数。优选地,还包括:所抓取的多个公众号被划分为多个分类,每一个所述分类包括多个公众号;在每一个所述分类下,按照所述公众号的健康度G对公众号进行排序;按照所述公众号的所属分类及所述公众号的健康度G的排序结果向用户推送所述公众号。优选地,用户具有一个或多个标签,每个所述标签对应一个所述分类,按照所述公众号的所属分类及所述公众号的健康度G的排序结果将向用户推送所述公众号的步骤包括:在一个所述分类下,将健康度G排在前R%的公众号推送给具有对应于该分类的标签的用户,R为0至30中的整数。优选地,所述第一互动参数和所述第二互动参数是阅读数、点赞数、转发数、评论数、收藏数及关注数中的任意两个。优选地,所述第一互动参数为阅读数,所述第二互动参数为点赞数。优选地,所述第一互动参数为阅读数,所述第二互动参数为转发数。优选地,所述第一互动参数为阅读数,所述第二互动参数为评论数。优选地,其特征在于,a的取值范围为0.01至0.1。优选地,所述公众号信息为社交网络平台的公众号发布的文章、图片、音频和/或视频。优选地,通过一个或多个所述社交网络平台的API接口收集所述公众号信息的第一互动参数和第二互动参数。根据本专利技术的一个方面,还提供一种公众号的健康度排序系统,根据上述的公众号的健康度排序方法,对多个所述公众号进行排序,并根据所述公众号的健康度的排序结果向用户推送所述公众号。优选地,还包括:将健康度G排在前R%的公众号推送给用户,R为0至30中的整数。由于采用了以上技术,本专利技术公众号的健康度排序方法及其排序系统能有效准确地通过基于多个数据的排序计算获得总和反应账号所发文章的平均影响力、发表文章的间隔时间及其稳定性的账号健康度,并且重新利用健康度来推送有价值信息。附图说明以下结合附图和具体实施例对本专利技术的技术方案进行详细的说明本文档来自技高网
...

【技术保护点】
一种公众号的健康度排序方法,其特征在于,包括:收集多个公众号在第一时间段内各自发布的所有公众号信息的总数量F、每条所述公众号信息的间隔时间B(N)、全部所述公众号信息的间隔时间的平均值A、间隔时间的标准差V、平均影响力S、以及最后一次发布所述公众号信息与观测日期的间隔天数T;其中,每条所述公众号信息与在第一时间段内的第一天的间隔天数作为每条所述公众号信息的间隔时间B(N),总数量F、间隔时间B(N)和间隔天数T都属于大于0的整数;当所述公众号在第一时间段内发布的所述公众号信息的总数量F等于1时,健康度参考值E=S/exp(T)*exp(A)*10000;当所述公众号在第一时间段内发布的所述公众号信息的总数量F大于1时,健康度参考值E=S/exp(T)*exp(A)*exp(V);以及对所述健康度参考值E作数据0‑1标准化,并乘以100,映射到[0,100]内的帐号健康度G,G属于[0,100]内的有理数。

【技术特征摘要】
1.一种公众号的健康度排序方法,其特征在于,包括:收集多个公众号在第一时间段内各自发布的所有公众号信息的总数量F、每条所述公众号信息的间隔时间B(N)、全部所述公众号信息的间隔时间的平均值A、间隔时间的标准差V、平均影响力S、以及最后一次发布所述公众号信息与观测日期的间隔天数T;其中,每条所述公众号信息与在第一时间段内的第一天的间隔天数作为每条所述公众号信息的间隔时间B(N),总数量F、间隔时间B(N)和间隔天数T都属于大于0的整数;当所述公众号在第一时间段内发布的所述公众号信息的总数量F等于1时,健康度参考值E=S/exp(T)*exp(A)*10000;当所述公众号在第一时间段内发布的所述公众号信息的总数量F大于1时,健康度参考值E=S/exp(T)*exp(A)*exp(V);以及对所述健康度参考值E作数据0-1标准化,并乘以100,映射到[0,100]内的帐号健康度G,G属于[0,100]内的有理数。2.如权利要求1所述的公众号的健康度排序方法,其特征在于,所述第一时间段是最近一个月的时间跨度。3.如权利要求2所述的公众号的健康度排序方法,其特征在于,所述公众号帐号的健康度G=100*[该帐号健康度值–min(所有帐号健康度值)]/[max(所有帐号健康度值)–min(所有帐号健康度值)]。4.如权利要求2所述的公众号的健康度排序方法,其特征在于,获得所有公众号信息的平均影响力S包括以下步骤:抓取对应多个公众号信息的第一互动参数Y和第二互动参数D;基于所述公众号信息的第一互动参数Y和第二互动参数D,按下述步骤计算所述公众号信息的影响力W:当所述公众号信息的第一互动参数Y大于等于第一阈值时,计算所述公众号信息的修正第二互动参数:Dm(DT)=exp[1/(DT+1)]*D(DT),其中,DT为所述公众号信息的第一互动参数达到所述第一阈值的日期与当前日期之间的间隔天数,Dm(DT)为公众号信息的当前日期的修正第二互动参数,D(DT)为当前日期的公众号信息的第二互动参数;当DT大于0时,按如下公式计算公众号信息的影响力W:W=aY(DT)+(1-a)[Dm(DT)+Dm(DT-1)-D(DT-1)],其中,a为有理数,Y(DT)为公众号信息的当前日期的第一互动参数,Dm(DT-1)为当前日期前一天的公众号信息的修正第二互动参数,D(DT-1)为当前日期前一天的公众号信息的第二互动参数;最后,按如下公式计算公众号信息的平均响力S:S=W/F。5.如权利要求4所述的公众号的健康度排序方法,其特征在于,当所述公众号信息的第一互动参数Y小于所述第一阈值时,按如下公式计算公众号信息的影响力W:W=aY+(1-a)D。6.如权利要求4所述的公众号的健康度排序方法,其特征在于,当为DT等于0时,按如下公式计算公众号信息的影响力W:W=aY(0)+(1-a)[Dm(0)],其中,Y(0)为所...

【专利技术属性】
技术研发人员:谢兵清王璐付裕李攀登胡南西
申请(专利权)人:北京蓝色光标品牌管理顾问股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1