一种关键词的重要度计算方法、装置、服务器及介质制造方法及图纸

技术编号:22330240 阅读:41 留言:0更新日期:2019-10-19 12:18
本发明专利技术实施例公开了一种关键词的重要度计算方法、装置、服务器及介质,其中方法包括:确定目标文件的传播用户集,所述传播用户集包括至少一个呈现所述目标文件的用户终端对应用户的用户标识;获取所述目标文件的关键词集合,并获取所述传播用户集中各用户标识对应的浏览日志;基于所述传播用户集中各用户标识对应的浏览日志,确定所述关键词集合中各关键词对应的浏览信息,并根据所述各关键词对应的浏览信息,确定所述各关键词对应于所述目标文件的关键词重要度,可实现对文件关键词重要度的准确计算,从而有效提升文件推送的精准度。

【技术实现步骤摘要】
一种关键词的重要度计算方法、装置、服务器及介质
本专利技术涉及计算机
,尤其涉及一种关键词的重要度计算方法、装置、服务器及介质。
技术介绍
随着互联网技术的深入发展,当前在进行文件推送时,是基于用户的历史浏览记录确定出用户的感兴趣目录,从而可基于所述用户的感兴趣目录进行文件的推送,而当前在基于用户的感兴趣目录进行文件推送时,主要是基于待推送文件的主题是否和所述用户的感兴趣目录相关进行的,服务器为了确定待推送文件的主题是否和感兴趣目标相关,可通过该用户的感兴趣目录是否包括该待推送文件的主题词确定。由于单靠文件的主题词确定和用户的感兴趣目录是否匹配的方式比较单一,所以不能准确地确定出文件的主题,也就降低了文件推送的准确性。
技术实现思路
本专利技术实施例提供了一种关键词的重要度计算方法、装置、服务器及介质,可实现对文件关键词重要度的准确计算,从而有效提升文件推送的精准度。一方面,本专利技术实施例提供了一种关键词的重要度计算方法,包括:确定目标文件的传播用户集,所述传播用户集包括至少一个呈现所述目标文件的用户终端对应用户的用户标识;获取所述目标文件的关键词集合,并获取所述传播用户集中各用户标识对应的浏览日志;基于所述传播用户集中各用户标识对应的浏览日志,确定所述关键词集合中各关键词对应的浏览信息,并根据所述各关键词对应的浏览信息,确定所述各关键词对应于所述目标文件的关键词重要度。另一方面,本专利技术实施例提供了一种关键词的重要度计算装置,包括:确定单元,用于确定目标文件的传播用户集,所述传播用户集包括至少一个呈现所述目标文件的用户终端对应用户的用户标识;获取单元,用于获取所述目标文件的关键词集合,并获取所述传播用户集中各用户标识对应的浏览日志;所述确定单元,还用于基于所述传播用户集中各用户标识对应的浏览日志,确定所述关键词集合中各关键词对应的浏览信息,并根据所述各关键词对应的浏览信息,确定所述各关键词对应于所述目标文件的关键词重要度。再一方面,本专利技术实施例提供了一种服务器,包括处理器、存储器和通信接口,所述处理器、所述存储器和所述通信接口相互连接,其中,所述存储器用于存储计算机程序指令,所述处理器被配置用于执行所述程序指令,执行如下步骤:确定目标文件的传播用户集,所述传播用户集包括至少一个呈现所述目标文件的用户终端对应用户的用户标识;获取所述目标文件的关键词集合,并获取所述传播用户集中各用户标识对应的浏览日志;基于所述传播用户集中各用户标识对应的浏览日志,确定所述关键词集合中各关键词对应的浏览信息,并根据所述各关键词对应的浏览信息,确定所述各关键词对应于所述目标文件的关键词重要度。再一方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序指令,所述计算机程序指令被处理器执行时,用于执行如第一方面所述的关键词的重要度计算方法。在本专利技术实施例中,服务器可确定目标文件的传播用户集,并可获取所述目标文件的关键词集合,以及所述传播用户集中各用户标识对应的浏览日志,从而可基于所述传播用户集中各用户标识对应的浏览日志,确定出该关键词集合中各关键词对应的浏览信息,从而可基于该关键词对应的浏览信息,确定出所述各关键词对应于所述目标文件的关键词重要度,可实现对目标文件中各关键词重要度的有效计算,使得服务器可基于确定的关键词重要度,向用户定向推送满足用户查看需求的文件,可有效提升文件推送的精准度,从而提升用户对文件的查看体验。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种确定文件的传播用户集以及传播用户集中不同用户对应的浏览日志的示意图;图2是本专利技术实施例提供的一种关键词的重要度计算方法的示意流程图;图3是本专利技术另一实施例提供的一种关键词的重要度计算方法的示意流程图;图4是本专利技术实施例提供的一种确定关键词对应于用户的点击通过率的示意图;图5是本专利技术实施例提供的一种关键词的重要度计算装置的示意性框图;图6是本专利技术实施例提供的一种服务器的示意性框图。具体实施方式本专利技术实施提出了一种关键词的重要度计算方法,以确定任一文件(所述任一文件可作为目标文件)中包括的各关键词对应于所述目标文件的关键词重要度,同时,也可确定出不同用户所关注的不同关键词对应于目标文件的重要度,从而可根据目标文件中各关键词的重要度和所述用户所关注的关键词,向用户定向推送包括所述用户所关注的关键词的文件。在一个实施中,所述目标文件例如可以是文本目标文件、音频目标文件或视频目标文件等,所述文本目标文件例如可以是新闻或小说等文章,在本专利技术实施中,主要以目标文件为文本文件进行详细说明,在该目标文件为音频文件或视频文件时,可参见本专利技术实施例。在一个实施例中,服务器可基于用户的行为数据为目标文件中的各关键词(即tag)进行关键词重要度计算,具体地,在对目标文件中的关键词进行重要度计算时,可基于用户对该目标文件的点击通过率(ClickThroughRate,CTR)确定,所述用户对所述目标文件的点击通过率是指:将所述目标文件推送到用户对应终端的次数以及该用户对推送目标文件的查看次数之间的比值。例如在所述目标文件为文本目标文件(具体如新闻)时,确定该新闻中各关键词的重要度方法是通过确定将该新闻推送到某用户的次数,以及该用户对该推送新闻的查看次数之间的比值确定的。在服务器采用关键词的重要度计算方法对目标文件中的关键词进行重要度计算之前,可先确定目标文件中的多个关键词,从而对该目标文件中的各个关键词进行重要度计算。其中,在对目标文件中的各个关键词进行关键词重要度计算时,可基于用户浏览日志(session)的展示,确定用户对推送文件的点击次数,基于该点击次数可确定目标文件中各关键词的重要度,其中,服务器可将点击次数越多的关键词对应的重要度确定为较大值。具体地,如图1所示,如果目标文件为文本文件A,则所述服务器可先确定将该文本文件A推送到的传播用户集users,所述传播用户集users用于记录该服务器将文本文件推送到的用户对应的用户标识,如图所示,确定的文本文件A的传播用户集users包括用户1~用户N。进一步地,服务器在确定将该文本文件A推送到的传播用户集users后,针对该传播用户集users中的任一用户(假设该任一用户为用户1),可确定该用户1对应的浏览日志session,如图所示,确定的所述用户1对应的浏览日志session中包括浏览文件a、浏览文件b,浏览文件x等浏览文件,从而服务器可统计该文本文件A中的每个关键词在所述用户1的浏览日志session中的呈现次数(或展示次数),以及点击次数。在一个实施例中,可将文本文件A中每个关键词在用户1的session中的呈现次数可用fre_show(tag)进行标记,并可将该每个关键词的点击次数用fre_click(tag)进行标记。所述服务器通过遍历所述传播用户集users中每个用户对文本文件A中各关键词的呈现次数和点击次数,可确定所述文本文件A中每个关键词在所述传播用户集users中所有用本文档来自技高网...

【技术保护点】
1.一种关键词的重要度计算方法,其特征在于,包括:确定目标文件的传播用户集,所述传播用户集包括至少一个呈现所述目标文件的用户终端对应用户的用户标识;获取所述目标文件的关键词集合,并获取所述传播用户集中各用户标识对应的浏览日志;基于所述传播用户集中各用户标识对应的浏览日志,确定所述关键词集合中各关键词对应的浏览信息,并根据所述各关键词对应的浏览信息,确定所述各关键词对应于所述目标文件的关键词重要度。

【技术特征摘要】
1.一种关键词的重要度计算方法,其特征在于,包括:确定目标文件的传播用户集,所述传播用户集包括至少一个呈现所述目标文件的用户终端对应用户的用户标识;获取所述目标文件的关键词集合,并获取所述传播用户集中各用户标识对应的浏览日志;基于所述传播用户集中各用户标识对应的浏览日志,确定所述关键词集合中各关键词对应的浏览信息,并根据所述各关键词对应的浏览信息,确定所述各关键词对应于所述目标文件的关键词重要度。2.根据权利要求1所述的方法,其特征在于,所述基于所述传播用户集中各用户标识对应的浏览日志,确定所述关键词集合中各关键词对应的浏览信息,包括:针对所述传播用户集中的目标用户标识,确定所述目标用户标识对应的目标浏览日志;基于所述目标浏览日志,确定所述目标文件中的任一关键词对应于目标用户的点击通过率;根据所述目标用户的点击通过率,确定所述关键词集合中各关键词对应的浏览信息;其中,所述点击通过率是根据将所述任一关键词呈现到所述目标用户对应终端的次数,以及所述目标用户通过所述对应终端查看所述任一关键词的次数确定的。3.根据权利要求2所述的方法,其特征在于,所述根据所述目标用户的点击通过率,确定所述关键词集合中各关键词对应的浏览信息,包括:将所述传播用户集中各用户标识依次作为目标用户标识,以确定所述目标文件中的任一关键词分别对应于所述传播用户集中各用户的点击通过率;将所述任一关键词分别对应于所述传播用户集中各用户的点击通过率进行累加,得到所述任一关键词对应的浏览信息。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:根据所述目标文件中的任一关键词,从所述目标浏览日志中筛选出包括所述任一关键词的参考文件集;确定所述参考文件集中的文件数量,并将所述确定的文件数量作为所述任一关键词呈现到所述目标用户对应终端的次数。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述目标文件的候选词集合,按照预设算法对所述候选词集合中各候选词...

【专利技术属性】
技术研发人员:宋原
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1