The invention discloses a method and a device for generating heat information. The method includes: acquiring keyword sets, which include: multiple keywords; acquiring extended word sets according to keyword sets. The words in extended word sets include: multiple keywords and similar words similar to each keyword in multiple keywords; acquiring and expanding from predetermined user behavior data sets. Word-matching target user behavior data in the exhibition set, which is used to indicate user behavior, the number of times user behavior is executed, and the type of behavior that user behavior belongs to. According to the target user behavior data, the thermal information of each behavior type is generated, and the thermal information of the behavior type is used to indicate the line. For the type of heat. The invention solves the technical problem that the relevant technology has a narrow coverage of the thermal information reflected by the analysis results for the exponential analysis of a single word, thereby leading to a low accuracy of the thermal information.
【技术实现步骤摘要】
热度信息的生成方法和装置
本专利技术涉及计算机领域,具体而言,涉及一种热度信息的生成方法和装置。
技术介绍
随着互联网社交产品的多样性变化以及用户群规模的不断膨胀,互联网所覆盖的范围越来越大。基于互联网产品来定义的指数也越来越多,例如google趋势,百度指数,360指数等,这些指数可以用于度量互联网用户对某一事物的热度及变化趋势。例如,百度指数是以百度海量网民行为数据为基础的数据分享平台,是当前互联网乃至整个数据时代最重要的统计分析平台之一,自发布之日便成为众多企业营销决策的重要依据。百度指数能够反映:某个关键词在百度的搜索规模有多大,一段时间内的涨跌态势以及相关的新闻舆论变化,关注这些词的网民是什么样的,分布在哪里,同时还搜了哪些相关的词等,百度指数可以帮助用户优化数字营销活动方案。但是,相关技术针对单个词的指数分析,分析结果所反映的热度信息的覆盖面较窄,进而导致热度信息的准确度较低,无法为数字营销提供准确的数据支持。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种热度信息的生成方法和装置,以至少解决相关技术针对单个词的指数分析,分析结果所反映的热度信息的覆盖面较窄,进而导致热度信息的准确度较低的技术问题。根据本专利技术实施例的一个方面,提供了一种热度信息的生成方法,包括:获取关键词集合,其中,关键词集合包括:多个关键词;根据关键词集合获取扩展词集合,其中,扩展词集合中的词语包括:多个关键词以及与多个关键词中的每个关键词相似的相似词;从预定的用户行为数据集合中获取与扩展词集合中的词语匹配的目标用户行为数据,其中,目标用 ...
【技术保护点】
1.一种热度信息的生成方法,其特征在于,包括:获取关键词集合,其中,所述关键词集合包括:多个关键词;根据所述关键词集合获取扩展词集合,其中,所述扩展词集合中的词语包括:所述多个关键词以及与所述多个关键词中的每个关键词相似的相似词;从预定的用户行为数据集合中获取与所述扩展词集合中的词语匹配的目标用户行为数据,其中,所述目标用户行为数据至少用于指示用户行为、所述用户行为执行的次数、所述用户行为所属的行为类型;根据所述目标用户行为数据生成每个所述行为类型的热度信息,其中,所述行为类型的热度信息用于指示所述行为类型的热度。
【技术特征摘要】
1.一种热度信息的生成方法,其特征在于,包括:获取关键词集合,其中,所述关键词集合包括:多个关键词;根据所述关键词集合获取扩展词集合,其中,所述扩展词集合中的词语包括:所述多个关键词以及与所述多个关键词中的每个关键词相似的相似词;从预定的用户行为数据集合中获取与所述扩展词集合中的词语匹配的目标用户行为数据,其中,所述目标用户行为数据至少用于指示用户行为、所述用户行为执行的次数、所述用户行为所属的行为类型;根据所述目标用户行为数据生成每个所述行为类型的热度信息,其中,所述行为类型的热度信息用于指示所述行为类型的热度。2.根据权利要求1所述的方法,其特征在于,所述根据所述关键词集合获取扩展词集合包括:从相似词集合中获取与所述多个关键词中的每个关键词相似的目标相似词;在所述多个关键词和所述目标相似词中过滤掉无效词,得到所述扩展词集合。3.根据权利要求2所述的方法,其特征在于,所述从相似词集合中获取与所述多个关键词中的每个关键词相似的目标相似词包括:对于每个所述关键词,执行以下步骤,其中,所述每个所述关键词被视为当前关键词:在所述当前关键词的相似词集合中查找与所述当前关键词相似的目标相似词,其中,所述与所述当前关键词相似的目标相似词与所述当前关键词之间的向量距离小于或等于预定阈值。4.根据权利要求2所述的方法,其特征在于,所述在所述多个关键词和所述目标相似词中过滤掉无效词,得到所述扩展词集合包括:展示所述多个关键词和所述目标相似词;接收过滤指令,其中,所述过滤指令中携带需要过滤掉的所述无效词;响应所述过滤指令,在所述多个关键词和所述目标相似词中过滤掉所述无效词,得到所述扩展词集合。5.根据权利要求1所述的方法,其特征在于,所述从预定的用户行为数据集合中获取与所述扩展词集合中的词语匹配的目标用户行为数据包括:在所述用户行为数据集合中查找所述目标用户行为数据,其中,所述目标用户行为数据所指示的用户行为或行为类型与所述扩展词集合中的词语匹配。6.根据权利要求5所述的方法,其特征在于,所述目标用户行为数据所指示的用户行为或行为类型与所述扩展词集合中的词语匹配包括:所述目标用户行为数据中用于指示所述用户行为或行为类型的行为信息包括:所述扩展词集合中的词语,或,与所述扩展词集合中的词语相关的词语。7.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户行为数据生成每个所述行为类型的热度信息包括:根据所述目标用户行为数据计算每个所述行为类型的热度指数,其中,所述行为类型的热度指数用于指示所述行为类型的热度信息,所述行为类型的热度指数为属于所述行为类型的用户行为执行的次数与预先分配给所述属于所述行为类型的用户行为的权重的乘积。8.根据权利要求1至7中任一项所述的...
【专利技术属性】
技术研发人员:赵琳琳,张纪红,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。