信息流平台作者的评分方法和装置制造方法及图纸

技术编号:20945382 阅读:30 留言:0更新日期:2019-04-24 02:45
本发明专利技术提供了一种信息流平台作者的评分方法和装置。该方法包括:从多个不同渠道获取信息流平台的用户原始日志;通过规则解析引擎对所述用户原始日志进行解析,得到解析后的用户日志,其中所述规则解析引擎是根据所述不同渠道各自的日志解析规则构建的;从所述信息流平台的后台数据库中获取作者日志;根据所述解析后的用户日志和所述作者日志统计特定时间段内每一作者的产出表现的评价指标,其中,所述评价指标包括质量、产能、热度、专业度和信用度;对所述质量、产能、热度、专业度和信用度进行加权求和,得到该作者的评价分数。本发明专利技术实现多源数据融合,保证了数据的准确性、稳定性和可用性,并保证对作者评价的公平性、客观性和准确性。

The Method and Device of Author's Scoring in Information Flow Platform

The invention provides an evaluation method and device for authors of an information flow platform. The method includes: obtaining user's original log of information flow platform from multiple different channels; parsing the user's original log by rule parsing engine to get the parsed user log, which is constructed according to the respective log parsing rules of the different channels; obtaining the author's log from the background database of the information flow platform; According to the parsed user log and the author log, each author's output performance evaluation index in a specific period of time is counted. The evaluation index includes quality, productivity, heat, professionalism and credit. The author's evaluation score is obtained by weighted summation of the quality, productivity, heat, professionalism and credit. The invention realizes multi-source data fusion, ensures the accuracy, stability and availability of data, and ensures the fairness, objectivity and accuracy of the author's evaluation.

【技术实现步骤摘要】
信息流平台作者的评分方法和装置
本专利技术涉及互联网
,特别是一种信息流平台作者的评分方法、信息流平台作者的评分装置、计算机存储介质以及计算设备。
技术介绍
信息流(feed)是一种可以滚动浏览的内容流。目前信息流平台的用户数量庞大,为了提供给用户良好的阅读体验,需根据用户行为数据对平台作者进行评价,从而对作者质量进行把控。在当前的企业中,为了更全面了解用户,需要从多个产品和维度获取不同的用户行为数据,进而对作者做出更加全面的评价。然而,由于公司规模及技术储备各异、多源数据体量庞大、规则混乱、流程繁琐、数据延迟及异常、业务需求各异等问题,导致很难快速搭建实用、准确、稳定的多源数据融合体系。另外,现有的作者评价体系中,使用机器学习算法来实现对作者表现的评价,具体实现方式为:选定一部分作者的相关数据作为数据集,根据用户的行为数据对作者标注分数,将选定的数据集划分为训练集和测试集,根据训练集训练不同的回归模型,使用测试集数据选择最优的回归模型,根据选出的最优回归模型对待测数据进行预测。然而,使用回归模型来评价作者的表现,实际上是学习对于作者标注标签的规则,但回归模型总存在一定的错误率,不能保证100%的正确率,所以无法保证对于所有作者的公平性。因此,亟需一种能够保证多源数据的准确性和稳定性,并且保证对于作者的公平性的作者评价方法。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的信息流平台作者的评分方法、信息流平台作者的评分装置、计算机存储介质以及计算设备。根据本专利技术实施例的一方面,提供了一种信息流平台作者的评分方法,包括:从多个不同渠道获取信息流平台的用户原始日志;通过规则解析引擎对所述用户原始日志进行解析,得到解析后的用户日志,其中所述规则解析引擎是根据所述不同渠道各自的日志解析规则构建的;从所述信息流平台的后台数据库中获取作者日志;根据所述解析后的用户日志和所述作者日志对所述信息流平台的作者进行评分。可选地,所述不同渠道包括移动设备应用程序APP客户端和/或个人电脑APP客户端。可选地,在从所述信息流平台的后台数据库中获取作者日志之后,所述方法还包括:将所述解析后的用户日志和所述作者日志保存入Hadoop分布式文件系统中。可选地,所述解析后的用户日志和所述作者日志通过作者发表的文章/视频的统一资源定位符URL相关联。可选地,在对所述信息流平台的作者进行评分之后,所述方法还包括:将对所述信息流平台的作者的评分结果保存到MySQL数据表中。可选地,根据所述解析后的用户日志和所述作者日志对所述信息流平台的作者进行评分,包括:根据所述解析后的用户日志和所述作者日志统计特定时间段内每一作者的产出表现的评价指标,并根据所述评价指标计算该作者的评价分数。可选地,所述评价指标包括质量、产能、热度、专业度和信用度;根据所述评价指标计算该作者的评价分数,包括:对所述质量、产能、热度、专业度和信用度进行加权求和,得到该作者的评价分数。可选地,根据每一作者发表的文章/视频的用户评价参数统计该作者的质量,其中,所述用户评价参数包括阅读/观看时长、用户点击数据、用户分享数据、用户评论数据、用户收藏数据和用户点赞数据中的一个或多个。可选地,根据以下公式统计每一作者的质量Q(X):Q(X)=转化率+阅读/观看时长+log(平均表现)+log(最优表现);其中,转化率=点击率+分享率+评论率+收藏率+点赞率-不喜欢率,平均表现=平均点击量+平均分享量+平均评论量+平均收藏量+平均点赞量,最优表现=最高点击量+最高分享量+最高评论量+最高收藏量+最高点赞量,转化率、阅读/观看时长、log(平均表现)和log(最优表现)都进行归一化处理。可选地,所述产能用于表征作者的产出效率;根据每一作者的文章/视频的发表数量和发表效率统计该作者的产能。可选地,根据以下公式统计每一作者的产能P1:P1=log(发表数量)+发表效率;其中,发表数量为该作者发表的文章或视频的总数量,发表效率为该作者在指定时间段内发表了文章或视频的天数与该指定时间段的总天数之比和该作者在该指定时间段内发表了文章或视频的周数与该指定时间段的总周数之比的加和,log(发表数量)和发表效率都进行归一化处理。可选地,所述指定时间段为每月。可选地,根据每一作者发表的文章/视频的用户关注量、用户浏览量和用户分享量统计该作者的热度。可选地,根据以下公式统计每一作者的热度P2:P2=log(用户关注量)+log(用户浏览量)+log(用户分享量);其中,log(用户关注量)、log(用户浏览量)和log(用户分享量)都进行归一化处理。可选地,所述专业度用于表征作者在不同领域的影响力;根据每一作者在不同领域的质量和产能统计该作者的专业度。可选地,根据以下公式统计每一作者在每一领域的专业度P3:P3=某一领域的质量与产能的加和/所有领域的质量与产能的加和。可选地,根据以下公式统计每一作者的信用度C:C=100-审核扣分-用户投诉扣分;其中,所述审核扣分的标准包括下列至少之一:违反法律规定、违背社会公德、含有不良信息。可选地,根据所述解析后的用户日志和所述作者日志统计特定时间段内每一作者的产出表现的评价指标,并根据所述评价指标计算该作者的评价分数,包括:根据所述解析后的用户日志和所述作者日志分别统计所述特定时间段内每一作者的文章产出表现的评价指标和视频产出表现的评价指标;分别根据所述文章产出表现的评价指标和所述视频产出表现的评价指标,计算得到该作者的文章整体评价分数和视频整体评价分数;对该作者的文章整体评价分数和视频整体评价分数进行加权求和,得到该作者的综合评价分数。可选地,根据所述解析后的用户日志和所述作者日志分别统计所述特定时间段内每一作者的文章产出表现的评价指标和视频产出表现的评价指标,包括:根据所述解析后的用户日志和所述作者日志分别统计所述特定时间段内每一作者在各不同领域中的文章产出表现的评价指标和视频产出表现的评价指标;分别根据所述文章产出表现的评价指标和所述视频产出表现的评价指标,计算得到该作者的文章整体评价分数和视频整体评价分数,包括:分别根据该作者在各领域中的所述文章产出表现的评价指标和所述视频产出表现的评价指标,计算得到该作者在各领域中的文章评价分数和视频评价分数;对该作者在各领域中的文章评价分数进行加权求和,得到该作者的文章整体评价分数;对该作者在各领域中的视频评价分数进行加权求和,得到该作者的视频整体评价分数。根据本专利技术实施例的另一方面,还提供了一种信息流平台作者的评分装置,包括:用户日志获取模块,适于从多个不同渠道获取信息流平台的用户原始日志;用户日志解析模块,适于通过规则解析引擎对所述用户原始日志进行解析,得到解析后的用户日志,其中所述规则解析引擎是根据所述不同渠道各自的日志解析规则构建的;作者日志获取模块,适于从所述信息流平台的后台数据库中获取作者日志;以及作者评分统计模块,适于根据所述解析后的用户日志和所述作者日志对所述信息流平台的作者进行评分。可选地,所述不同渠道包括移动设备应用程序APP客户端和/或个人电脑APP客户端。可选地,所述装置还包括:日志数据保存模块,适于将所述解析后的用户日志和所述获取的作者日志保本文档来自技高网...

【技术保护点】
1.一种信息流平台作者的评分方法,包括:从多个不同渠道获取信息流平台的用户原始日志;通过规则解析引擎对所述用户原始日志进行解析,得到解析后的用户日志,其中所述规则解析引擎是根据所述不同渠道各自的日志解析规则构建的;从所述信息流平台的后台数据库中获取作者日志;根据所述解析后的用户日志和所述作者日志对所述信息流平台的作者进行评分。

【技术特征摘要】
1.一种信息流平台作者的评分方法,包括:从多个不同渠道获取信息流平台的用户原始日志;通过规则解析引擎对所述用户原始日志进行解析,得到解析后的用户日志,其中所述规则解析引擎是根据所述不同渠道各自的日志解析规则构建的;从所述信息流平台的后台数据库中获取作者日志;根据所述解析后的用户日志和所述作者日志对所述信息流平台的作者进行评分。2.根据权利要求1所述的方法,其中,所述不同渠道包括移动设备应用程序APP客户端和/或个人电脑APP客户端。3.根据权利要求1或2所述的方法,其中,在从所述信息流平台的后台数据库中获取作者日志之后,还包括:将所述解析后的用户日志和所述作者日志保存入Hadoop分布式文件系统中。4.根据权利要求3所述的方法,其中,所述解析后的用户日志和所述作者日志通过作者发表的文章/视频的统一资源定位符URL相关联。5.根据权利要求1-4中任一项所述的方法,其中,在对所述信息流平台的作者进行评分之后,还包括:将对所述信息流平台的作者的评分结果保存到MySQL数据表中。6.根据权利要求1-5中任一项所述的方法,其中,根据所述解析后的用户日志和所述作者日志对所述信息流平台的作者进行评分,包括:根据所述解析后的用户日志和所述作者日志统计特定时间段内...

【专利技术属性】
技术研发人员:陈翔张济显唐传洋韩振岭张颖李伟力赵国振范强任宝鑫
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1