【技术实现步骤摘要】
新闻热度计算方法、设备及存储介质
[0001]本申请涉及互联网
,尤其涉及一种新闻热度计算方法、设备及存储介质。
技术介绍
[0002]在信息时代,各类信息呈现井喷式增长,新闻也不例外。对大量的新闻进行分析、筛选,得到热点新闻,并将热点新闻推荐给用户,可便于用户及时了解热点话题,提升新闻阅读效率。
[0003]现有的新闻热度计算方法通常依赖于用户对新闻的点击量、评论量等等。这种方式较为依赖用户行为,无法得到准确的新闻热度分析结果。因此,有待提出一种新的解决方案。
技术实现思路
[0004]本申请的多个方面提供一种新闻热度计算方法、设备及存储介质,用以充分利用新闻,提升新闻热度分析结果的准确性。
[0005]本申请实施例提供一种新闻热度计算方法,包括:获取事件对应的新闻集合;从所述新闻集合中,确定发布间隔以及发布时间持续性满足设定条件的多个新闻;根据所述多个新闻对应的发布机构,确定所述多个新闻各自的热度权重;根据所述多个新闻各自的热度权重、所述发布间隔以及所述发布时间持续性,计算所述事件对
【技术保护点】
【技术特征摘要】
1.一种新闻热度计算方法,其特征在于,包括:获取事件对应的新闻集合;从所述新闻集合中,确定发布间隔以及发布时间持续性满足设定条件的多个新闻;根据所述多个新闻对应的发布机构,确定所述多个新闻各自的热度权重;根据所述多个新闻各自的热度权重、所述发布间隔以及所述发布时间持续性,计算所述事件对应的新闻热度。2.根据权利要求1所述的方法,其特征在于,从所述新闻集合中,确定发布间隔以及发布时间持续性满足设定条件的多个新闻,包括:按照时间先后顺序,对所述新闻集合中的新闻的发布时间进行排序,得到发布时间序列;采用第一滑动窗口,在所述发布时间序列上滑动,得到多个时间窗口;所述第一滑动窗口的窗口长度为设定的时间跨度;从所述多个时间窗口中,确定新闻数量满足设定数量要求的时间窗口,作为目标时间窗口;从所述目标时间标窗口中,截取发布间隔满足设定间隔要求的所述多个新闻。3.根据权利要求2所述的方法,其特征在于,从所述目标时间窗口中,截取发布间隔满足设定间隔要求的所述多个新闻,包括:采用第二滑动窗口,在所述目标时间窗口中滑动,得到多个子窗口;所述第二滑动窗口的长度为设定的数量长度;计算所述多个子窗口各自包含的新闻的平均间隔时长;根据所述平均间隔时长,从所述多个子窗口中确定目标子窗口,所述目标子窗口包含的新闻的平均间隔时间满足所述设定间隔要求。4.根据权利要求3所述的方法,其特征在于,根据所述多个新闻各自的热度权重以及所述多个新闻之间的时间间隔,计算所述事件对应的新闻热度,包括:确定所述目标子窗口中的每个新闻相对于相邻的前一新闻的时间间隔;将所述时间间隔作为指定底数的指数,计算每个新闻的指数项;根据每个新闻各自的热度权重对每个新闻的指数项进行加权计算,得到加权分数;计算所述加权分数与所述第二滑动窗口的长度的比值,作为所述事件对应的新闻热度。5.根据权利要求1
‑
4任一项所述的方法,其特征在于,获取事件对应的新闻集合,包括:采集新闻数据;针对所述新闻数据中的第一新闻文本和第二新闻文本,计算所述第一新闻文本和所述第二新闻文本之间的文本相似度;对所述第一新闻文本的新闻要素以及所述第二新闻文本的新闻要素进行重合度分析,得到新闻要素重合度;若所述文本相似度以及所述要素重合度满足设定条件,则将所述第一新闻文本和所述第二新闻文本划分到同一事件的新闻集合中。6.根据权利要求5所述的方法,其特征在于,计算所述第一新闻和所述...
【专利技术属性】
技术研发人员:计明杰,薛晓舟,蔡承蒙,陈邦忠,
申请(专利权)人:完美世界控股集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。