热点话题推送方法和装置制造方法及图纸

技术编号:16717933 阅读:45 留言:0更新日期:2017-12-05 16:23
本申请公开了一种热点话题推送方法及装置。所述方法的一具体实施方式包括:获取用户发表的对话题的评论信息,并提取所述话题的关键词;计算所述评论信息与提取的关键词的相似度,将相似度大于第一预设值的评论信息作为话题相关信息;分析在所述话题相关信息中发表评论信息的各用户之间的跟随关系;基于所述跟随关系,计算所述话题的预设参数的值,生成话题分析报告;将满足第一预设条件的话题分析报告对应的话题作为热点话题,推送所述热点话题。该实施方式实现了深入全面的了解热点话题。

Hot topic push method and device

The present application discloses a hot topic push method and device. Including a specific embodiment of the method: to get to the topic comment information published by users, and the topic keyword extraction; similarity calculation of the keywords review information and extraction, the similarity is greater than a first preset value comment information as a topic related information; analysis of the relationship between user reviews published following information in the topic related information; the following relation based on values of default parameters to calculate the topic, generate topic analysis report; analysis will meet the first preset conditions corresponding to the topic report topic as a hot topic, pushing the hot topic. The implementation of this method has realized a thorough and comprehensive understanding of hot topics.

【技术实现步骤摘要】
热点话题推送方法和装置
本申请涉及计算机
,尤其涉及互联网
,具体涉及一种热点话题推送方法和装置。
技术介绍
随着移动互联网的日益普及,网络社区成为人们获取信息、交流信息的重要渠道。大量网民在网络社区中发表自己的意见和爆料各种新闻,每天有成千上万个话题产生。如何从如此繁多的话题中选取热点话题并推送,从中获取网民的对热点话题的态度,将对了解社会发展形势、掌握舆论动向起到指导性的作用。目前,现有的热点话题推送方法主要是通过收集网络社区上一些特征数据(如,网民发帖量,发帖网民所在地理位置等),进行简单的统计分析后推送给用户或应用程序,不能够使用户全面和深入的了解热点话题。
技术实现思路
本申请的目的在于提出一种热点话题推送方法和装置,来解决以上
技术介绍
部分提到的技术问题。第一方面,本申请提供了一种热点话题推送方法,所述方法包括:获取用户发表的对话题的评论信息,并提取所述话题的关键词;计算所述评论信息与提取的关键词的相似度,将相似度大于第一预设值的评论信息作为话题相关信息;分析在所述话题相关信息中发表评论信息的各用户之间的跟随关系,所述跟随关系包括以下至少一项:回复关系、转发关系、引用关系;基于所述跟随关系,计算所述话题的预设参数的值,生成话题分析报告,所述预设参数包括以下至少一项:网络聚类系数、网络密度、在所述话题相关信息中发表评论信息的用户的数量,其中,所述网络聚类系数由在所述话题相关信息中发表评论信息的每个用户的聚类系数加权平均而得,所述网络密度表示在所述话题相关信息中发表评论信息的各用户的跟随关系的紧密程度,所述网络直径为在所述话题相关信息中发表评论信息的两个用户之间距离的最大值;将满足第一预设条件的话题分析报告对应的话题作为热点话题,推送所述热点话题。在一些实施例中,所述计算所述评论信息与提取的关键词的相似度,包括:对所述评论信息进行分词处理,得到多个词语;计算所述多个词语与提取的关键词的相似度。在一些实施例中,所述分析在所述话题相关信息中发表评论信息的各用户之间的跟随关系,包括:当用户在所述话题相关信息中发表的评论信息为回复所述话题相关信息中其它用户发表的评论信息时,确定两个用户之间为回复关系;和/或当用户在所述话题相关信息中发表的评论信息为转发所述话题相关信息中其它用户发表的评论信息时,确定两个用户之间为转发关系;和/或当用户在所述话题相关信息中发表的评论信息为引用所述话题相关信息中其它用户发表的评论信息时,确定两个用户之间为引用关系。在一些实施例中,所述基于所述跟随关系,计算所述话题的预设参数的值,生成话题分析报告,包括:基于所述跟随关系,采用以下公式建立用户跟随关系矩阵S:其中,S为所述用户跟随关系矩阵,k为正自然数,N为在所述话题相关信息中发表评论信息的用户的数量,当S为用户回复关系矩阵时,kij为第i个用户回复第j个用户发表的评论信息的次数,当S为用户转发关系矩阵时,kij为第i个用户转发第j个用户发表的评论信息的次数,当S为用户引用关系矩阵时,kij为第i个用户引用第j个用户发表的评论信息的次数,i∈[1,N],j∈[1,N],i≠j;当所述kij>0时,连线第i个用户与第j个用户,构建在所述话题相关信息中发表评论信息的各用户的跟随关系的拓扑图。在一些实施例中,所述基于所述跟随关系,计算所述话题的预设参数的值,生成话题分析报告,包括:根据以下公式计算在所述话题相关信息中发表评论信息的每个用户的聚类系数:其中,其中C为聚类系数,Ci为第i个用户的聚类系数,li为在所述拓扑图中与第i个用户连线的邻居用户数量,Ei为所述邻居用户之间的连线数量。在一些实施例中,所述基于所述跟随关系,计算所述话题的预设参数的值,生成话题分析报告,包括:根据以下公式计算所述网络密度:其中,B为所述网络密度,L为所述拓扑图中的连线数量。在一些实施例中,所述基于所述跟随关系,计算所述话题的预设参数的值,生成话题分析报告,包括:根据以下公式计算所述网络直径:D=maxdij;其中,D表示所述网络直径,d表示在所述拓扑图中各用户间的距离,dij表示在所述拓扑图中第i个用户与第j个用户间的距离,max表示对所述dij取最大值。在一些实施例中,所述基于所述跟随关系,计算所述话题的预设参数的值,生成话题分析报告,包括:将所述话题的各预设参数的值进行加权叠加,得到综合分析参数;生成包括所述综合分析参数的话题分析报告。第二方面,本申请提供一种热点话题推送装置,所述装置包括:评论信息获取单元,用于获取用户发表的对话题的评论信息,并提取所述话题的关键词;相关信息确定单元,用于计算所述评论信息与提取的关键词的相似度,将相似度大于第一预设值的评论信息作为话题相关信息;跟随关系分析单元,用于分析在所述话题相关信息中发表评论信息的各用户之间的跟随关系,所述跟随关系包括以下至少一项:回复关系、转发关系、引用关系;分析报告生成单元,用于基于所述跟随关系,计算所述话题的预设参数的值,生成话题分析报告,所述预设参数包括以下至少一项:聚类系数、网络密度、网络直径、在所述话题相关信息中发表评论信息的用户的数量,其中,所述聚类系数由在所述话题相关信息中发表评论信息的每个用户的聚类系数加权平均而得,所述网络密度表示在所述话题相关信息中发表评论信息的各用户的跟随关系的紧密程度,所述网络直径为在所述话题相关信息中发表评论信息的两个用户之间距离的最大值;热点话题推送单元,用于将满足第一预设条件的话题分析报告对应的话题作为热点话题,推送所述热点话题。在一些实施例中,所述相关信息确定单元,包括:分词模块,用于对所述评论信息进行分词处理,得到多个词语;计算模块,用于计算所述多个词语与提取的关键词的相似度。在一些实施例中,所述跟随关系分析单元,包括:回复确定模块,用于当用户在所述话题相关信息中发表的评论信息为回复所述话题相关信息中其它用户发表的评论信息时,确定两个用户之间为回复关系;和/或转发确定模块,用于当用户在所述话题相关信息中发表的评论信息为转发所述话题相关信息中其它用户发表的评论信息时,确定两个用户之间为转发关系;和/或引用确定模块,用于当用户在所述话题相关信息中发表的评论信息为引用所述话题相关信息中其它用户发表的评论信息时,确定两个用户之间为引用关系。在一些实施例中,所述分析报告生成单元,还包括:跟随关系矩阵建立模块,用于基于所述跟随关系,采用以下公式建立用户跟随关系矩阵S:其中,S为所述用户跟随关系矩阵,k为正自然数,N为在所述话题相关信息中发表评论信息的用户的数量,当S为用户回复关系矩阵时,kij为第i个用户回复第j个用户发表的评论信息的次数,当S为用户转发关系矩阵时,kij为第i个用户转发第j个用户发表的评论信息的次数,当S为用户引用关系矩阵时,kij为第i个用户引用第j个用户发表的评论信息的次数,i∈[1,N],j∈[1,N],i≠j;拓扑图构建模块,用于当所述kij>0时,连线第i个用户与第j个用户,构建在所述话题相关信息中发表评论信息的各用户的跟随关系的拓扑图。在一些实施例中,所述分析报告生成单元,还包括:聚类系数计算模块,用于根据以下公式计算在所述话题相关信息中发表评论信息的每个用户的聚类系数:其中,其中C为聚类系数,Ci为第本文档来自技高网...
热点话题推送方法和装置

【技术保护点】
一种热点话题推送方法,其特征在于,所述方法包括:获取用户发表的对话题的评论信息,并提取所述话题的关键词;计算所述评论信息与提取的关键词的相似度,将相似度大于第一预设值的评论信息作为话题相关信息;分析在所述话题相关信息中发表评论信息的各用户之间的跟随关系,所述跟随关系包括以下至少一项:回复关系、转发关系、引用关系;基于所述跟随关系,计算所述话题的预设参数的值,生成话题分析报告,所述预设参数包括以下至少一项:网络聚类系数、网络密度、网络直径、在所述话题相关信息中发表评论信息的用户的数量,其中,所述网络聚类系数由在所述话题相关信息中发表评论信息的每个用户的聚类系数加权平均而得,所述网络密度表示在所述话题相关信息中发表评论信息的各用户的跟随关系的紧密程度,所述网络直径为在所述话题相关信息中发表评论信息的两个用户之间距离的最大值;将满足第一预设条件的话题分析报告对应的话题作为热点话题,推送所述热点话题。

【技术特征摘要】
1.一种热点话题推送方法,其特征在于,所述方法包括:获取用户发表的对话题的评论信息,并提取所述话题的关键词;计算所述评论信息与提取的关键词的相似度,将相似度大于第一预设值的评论信息作为话题相关信息;分析在所述话题相关信息中发表评论信息的各用户之间的跟随关系,所述跟随关系包括以下至少一项:回复关系、转发关系、引用关系;基于所述跟随关系,计算所述话题的预设参数的值,生成话题分析报告,所述预设参数包括以下至少一项:网络聚类系数、网络密度、网络直径、在所述话题相关信息中发表评论信息的用户的数量,其中,所述网络聚类系数由在所述话题相关信息中发表评论信息的每个用户的聚类系数加权平均而得,所述网络密度表示在所述话题相关信息中发表评论信息的各用户的跟随关系的紧密程度,所述网络直径为在所述话题相关信息中发表评论信息的两个用户之间距离的最大值;将满足第一预设条件的话题分析报告对应的话题作为热点话题,推送所述热点话题。2.根据权利要求1所述的方法,其特征在于,所述计算所述评论信息与提取的关键词的相似度,包括:对所述评论信息进行分词处理,得到多个词语;计算所述多个词语与提取的关键词的相似度。3.根据权利要求1所述的方法,其特征在于,所述分析在所述话题相关信息中发表评论信息的各用户之间的跟随关系,包括:当用户在所述话题相关信息中发表的评论信息为回复所述话题相关信息中其它用户发表的评论信息时,确定两个用户之间为回复关系;和/或当用户在所述话题相关信息中发表的评论信息为转发所述话题相关信息中其它用户发表的评论信息时,确定两个用户之间为转发关系;和/或当用户在所述话题相关信息中发表的评论信息为引用所述话题相关信息中其它用户发表的评论信息时,确定两个用户之间为引用关系。4.根据权利要求3所述的方法,其特征在于,所述基于所述跟随关系,计算所述话题的预设参数的值,生成话题分析报告,包括:基于所述跟随关系,采用以下公式建立用户跟随关系矩阵S:其中,S为所述用户跟随关系矩阵,k为正自然数,N为在所述话题相关信息中发表评论信息的用户的数量,当S为用户回复关系矩阵时,kij为第i个用户回复第j个用户发表的评论信息的次数,当S为用户转发关系矩阵时,kij为第i个用户转发第j个用户发表的评论信息的次数,当S为用户引用关系矩阵时,kij为第i个用户引用第j个用户发表的评论信息的次数,i∈[1,N],j∈[1,N],i≠j;当所述kij>0时,连线第i个用户与第j个用户,构建在所述话题相关信息中发表评论信息的各用户的跟随关系的拓扑图。5.根据权利要求4所述的方法,其特征在于,所述基于所述跟随关系,计算所述话题的预设参数的值,生成话题分析报告,包括:根据以下公式计算在所述话题相关信息中发表评论信息的每个用户的聚类系数:其中,其中C为聚类系数,Ci为第i个用户的聚类系数,li为在所述拓扑图中与第i个用户连线的邻居用户数量,Ei为所述邻居用户之间的连线数量。6.根据权利要求4所述的方法,其特征在于,所述基于所述跟随关系,计算所述话题的预设参数的值,生成话题分析报告,包括:根据以下公式计算所述网络密度:其中,B为所述网络密度,L为所述拓扑图中的连线数量。7.根据权利要求4所述的方法,其特征在于,网络直径所述基于所述跟随关系,计算所述话题的预设参数的值,生成话题分析报告,包括:根据以下公式计算所述网络直径:D=maxdij;其中,D表示所述网络直径,d表示在所述拓扑图中各用户间的距离,dij表示在所述拓扑图中第i个用户与第j个用户间的距离,max表示对所述dij取最大值。8.根据权利要求4所述的方法,其特征在于,所述基于所述跟随关系,计算所述话题的预设参数的值,生成话题分析报告,包括:将所述话题的各预设参数的值进行加权叠加,得到综合分析参数;生成包括所述综合分析参数的话题分析报告。9.一种热点话题推送装置,其特征在于,所述...

【专利技术属性】
技术研发人员:刘姗
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1