【技术实现步骤摘要】
一种帖子热度的计算方法和装置
[0001]本专利技术涉及大数据
,尤其涉及一种帖子热度的计算方法和装置。
技术介绍
[0002]话题热度反映了人们对相应帖子中所介绍的现象或事件的关注程度。目前,已有的热度计算算法可以归结为以下两类:(1)根据一个帖子的历史热度来计算其未来热度的发展趋势;(2)根据类似话题的热度变化趋势来计算新话题的变化趋势。
[0003]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:
[0004]只考虑了帖子字面上的相似性,未涉及语义层面,因此无法准确地计算出帖子热度。
技术实现思路
[0005]有鉴于此,本专利技术实施例提供一种帖子热度的计算方法和装置,以解决无法准确地计算出帖子热度的技术问题。
[0006]为实现上述目的,根据本专利技术实施例的一个方面,提供了一种帖子热度的计算方法,包括:
[0007]根据各个历史帖子的用户操作,计算所述各个历史帖子的热度轨迹;
[0008]根据所述各个历史帖子的热度轨迹以及与所述各个历史 ...
【技术保护点】
【技术特征摘要】
1.一种帖子热度的计算方法,其特征在于,包括:根据各个历史帖子的用户操作,计算所述各个历史帖子的热度轨迹;根据所述各个历史帖子的热度轨迹以及与所述各个历史帖子的关联的话题,计算内容
‑
话题概率分布和各个话题的热度轨迹;根据所述内容
‑
话题概率分布,筛选出当前帖子的潜在话题;根据所述各个话题的热度轨迹,确定所述潜在话题的热度轨迹,从而计算所述当前帖子的热度轨迹。2.根据权利要求1所述的方法,其特征在于,根据各个历史帖子的用户操作,计算所述各个历史帖子的热度轨迹,包括:对于任意一个历史帖子,采用以下公式计算所述历史帖子在时间区间内的各个时间节点对应的热度,从而得到热度轨迹:热度=T时间内累计点击数量+(T时间内累计点赞数量+T时间内累计被踩数量)
×
2+T时间内累计回复数量
×
2+T时间内累计收藏数量
×
5+T时间内累计转发数量
×
5;其中,T表示所述历史帖子发表后第T日。3.根据权利要求2所述的方法,其特征在于,所述时间区间采用如下方式确定:4.根据权利要求1所述的方法,其特征在于,根据所述各个历史帖子的热度轨迹以及与所述各个历史帖子的关联的话题,计算内容
‑
话题概率分布和各个话题的热度轨迹,包括:将所述各个历史帖子的热度轨迹以及所述各个历史帖子与各个话题的关联关系输入到文档主题生成模型中进行无监督训练,从而计算得到内容
‑
话题概率分布和各个话题的热度轨迹。5.根据权利要求4所述的方法,其特征在于,根据所述内容
‑
话题概率分布,筛选出当前帖子的潜在话题,包括:将当前帖子输入到训练好的文档主题生成模型中,根据所述内容
‑
话题概率分布以及预设话题数量,筛选出所述当前帖子的若干个潜在话题。6.根据权利要求1所述的方法,其特征在于,根据所述各个话题的热度轨迹,确定所述潜在话题的热度轨迹,从而计算所述当前帖子的热度轨迹,包括:根据所述各个话题的热度轨迹,确定所述潜在话题的热度轨迹;将所述潜在话题在各个时间节点对应的热度分别相加,得到所述当前帖子在各个时间节点对应的热度,从而得到所述当前帖子的热度轨迹。7.一种帖子热度的计算装置,其特征在于,包括:第一计算模块,用于根据各个历史帖子的用户操...
【专利技术属性】
技术研发人员:蔡晨,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。