【技术实现步骤摘要】
一种关键词的指数确定方法、装置、设备及存储介质
本申请涉及互联网
,尤其涉及一种关键词的指数确定方法、装置、设备及存储介质。
技术介绍
关键词的指数是以海量网络信息数据为基础,用以反映关键词在过去一段时间内每天的变化趋势的数据表现形式,能够直接、客观地反映社会热点、网民的兴趣和需求,从而可以发现、共享和挖掘互联网上有价值的信息和资讯。现有的技术方案中对于各关键词指数一般都是基于全网公开的信息进行计算的,并呈现给用户,从而对于每一个关键词,各个用户看到的关键词指数都是一样的,没有任何差别,跟用户自身的相关性极小,不能体现出各个用户的特性。
技术实现思路
本申请所要解决的技术问题在于,提供一种关键词的指数确定方法、装置、设备及存储介质,能够结合网络公开信息以及用户操作记录信息进行关键词的指数计算,从而使得计算得出的关键词指数更加贴合用户的操作行为,并体现出用户特性。为了解决上述技术问题,一方面,本申请提供了一种关键词的指数确定方法,所述方法包括:获取关键词,对所述关键词进行分词,得到目标分词;在第一索引文件中查找与所述目标分词对应的目标对象的操作记录信息集合,所述第一索引文件中包括与多个分词对应的目标对象的操作记录信息集合;基于所述目标分词以及与所述目标分词对应的目标对象的操作记录信息集合,得到第一指数信息;将所述目标分词发送给服务器;接收所述服务器返回的基于所述目标分词和第二索引文件得到的第二指数信息,所述第二索引文件包括通过所述服务器对 ...
【技术保护点】
1.一种关键词的指数确定方法,其特征在于,包括:/n获取关键词,对所述关键词进行分词,得到目标分词;/n在第一索引文件中查找与所述目标分词对应的目标对象的操作记录信息集合,所述第一索引文件中包括与多个分词对应的目标对象的操作记录信息集合;/n基于所述目标分词以及与所述目标分词对应的目标对象的操作记录信息集合,得到第一指数信息;/n将所述目标分词发送给服务器;/n接收所述服务器返回的基于所述目标分词和第二索引文件得到的第二指数信息,所述第二索引文件包括通过所述服务器对网络信息进行处理得到的与多个分词对应的操作记录信息集合;/n基于所述第一指数信息和所述第二指数信息,确定所述关键词的指数。/n
【技术特征摘要】
1.一种关键词的指数确定方法,其特征在于,包括:
获取关键词,对所述关键词进行分词,得到目标分词;
在第一索引文件中查找与所述目标分词对应的目标对象的操作记录信息集合,所述第一索引文件中包括与多个分词对应的目标对象的操作记录信息集合;
基于所述目标分词以及与所述目标分词对应的目标对象的操作记录信息集合,得到第一指数信息;
将所述目标分词发送给服务器;
接收所述服务器返回的基于所述目标分词和第二索引文件得到的第二指数信息,所述第二索引文件包括通过所述服务器对网络信息进行处理得到的与多个分词对应的操作记录信息集合;
基于所述第一指数信息和所述第二指数信息,确定所述关键词的指数。
2.根据权利要求1所述的一种关键词的指数确定方法,其特征在于,每个操作记录信息集合中包括至少一项操作记录信息;
相应地,所述基于所述目标分词以及与所述目标分词对应的目标对象的操作记录信息集合,得到第一指数信息包括:
当所述目标分词的数量大于等于两个时,基于与各目标分词对应的目标对象的操作记录信息集合中的各项操作记录信息,求各操作记录信息集合的交集,得到第一集合;
确定所述第一集合中所述操作记录信息的项数为所述第一指数信息。
3.根据权利要求1所述的一种关键词的指数确定方法,其特征在于,所述与所述目标分词对应的目标对象的操作记录信息集合包括多个不同类型的操作记录信息子集合,每个操作记录信息子集合中包括至少一项操作记录信息;
相应地,所述基于所述目标分词以及与所述目标分词对应的目标对象的操作记录信息集合,得到第一指数信息包括:
当所述目标分词的数量大于等于两个时,对各目标分词对应的同类型的所述操作记录信息子集合求交集,得到多个同类型子集合;
确定每个同类型子集合中操作记录信息的项数,以及与每个类型的操作记录信息对应的权重;
基于每个同类型子集合中操作记录信息的项数以及相应的权重,计算得到所述第一指数信息。
4.根据权利要求1所述的一种关键词的指数确定方法,其特征在于,所述与所述目标分词对应的目标对象的操作记录信息集合包括多项不同类型的操作记录信息;
相应地,所述基于所述目标分词以及与所述目标分词对应的目标对象的操作记录信息集合,得到第一指数信息包括:
当所述目标分词的数量大于等于两个时,对各目标分词对应的操作记录信息集合求交集,得到第二集合;
对所述第二集合中的多项操作记录信息进行分类;
确定所述第二集合中每个类型的操作记录信息的项数,以及与每个类型的操作记录信息对应的权重;
基于每个类型的操作记录信息的项数以及相应的权重,计算得到所述第一指数信息。
5.根据权利要求1所述的一种关键词的指数确定方法,其特征在于,每个操作记录信息集合中包括至少一项操作记录信息;
相应地,所述基于所述目标分词以及与所述目标分词对应的目标对象的操作记录信息集合,得到第一指数信息包括:
当所述目标分词的数量大于等于两个时,记录在...
【专利技术属性】
技术研发人员:卓达城,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。