【技术实现步骤摘要】
本专利技术涉及互联网通信领域,特别涉及一种建立信息关系列表的方法及装置。
技术介绍
目前,互联网中存储有多种信息类型的信息,信息类型可以为视频、图书、歌曲或游戏等。用户经常在互联网中输入关键词来搜索某种信息类型的信息,为了更准确的搜索到用户需要搜索的信息类型的信息,需要在搜索平台中建立信息关系列表,该信息关系列表用于存储信息类型与关键词的对应关系,以便根据用户输入的关键词从该信息关系列表中获取到用户需要搜索的信息的信息类型。当前,现有技术存在一种建立信息关系列表的方法,包括:对于每种信息类型,技术人员事先凭经验搜集大量该种信息类型的分词,将这些分词作为该信息类型对应的关键词,将该种信息类型与这些关键词存储在搜索平台中的信息关系列表中。当用户搜索信息时,搜索平台根据用户输入的关键词,从信息关系列表中查找该关键词对应的信息类型,将查找出的信息类型确定为用户需要搜索的信息的信息类型,根据查找出的信息类型和用户输入的关键词搜索用户需要搜索的信息。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:由于技术人员经验有限,因此会导致信息类型对应的关键词中存在很多不属于该信息类型的关键词。如此根据事先建立的信息关系列表来获取信息类型时,会导致获取信息类型的准确性很低。
技术实现思路
为了提高获取信息类型的准确性,本专利技术提供了一种建立信息关系列表的方法及装置。所述技术方案如下 ...
【技术保护点】
一种建立信息关系列表的方法,其特征在于,所述方法包括:从历史搜索记录中,获取信息类型集合中的每种信息类型的信息,以及获取所述历史搜索记录中包括的每个关键词对应的信息和每个信息的点击次数;根据所述每种信息类型的信息、所述每个关键词对应的信息和每个信息的点击次数,获取所述每种信息类型对应的关键词;将所述每种信息类型和所述每种信息类型对应的关键词存储在信息关系列表中。
【技术特征摘要】
1.一种建立信息关系列表的方法,其特征在于,所述方法包括:
从历史搜索记录中,获取信息类型集合中的每种信息类型的信息,以及获
取所述历史搜索记录中包括的每个关键词对应的信息和每个信息的点击次数;
根据所述每种信息类型的信息、所述每个关键词对应的信息和每个信息的
点击次数,获取所述每种信息类型对应的关键词;
将所述每种信息类型和所述每种信息类型对应的关键词存储在信息关系列
表中。
2.如权利要求1所述的方法,其特征在于,所述根据所述每种信息类型的
信息、所述每个关键词对应的信息和每个信息的点击次数,获取所述每种信息
类型对应的关键词,包括:
从第一信息类型的信息中,获取点击次数大于预设次数阈值的信息,将所
述信息包含的链接组成所述第一信息类型对应的链接集合,所述第一信息类型
为所述信息类型集合中的任一信息类型;
从第一关键词对应的每个信息中,确定出包含的链接与所述链接集合中的
链接匹配的信息,所述第一关键词为所述历史搜索记录中包括的任一关键词;
根据所述匹配的信息的点击次数和所述第一关键词对应的每个信息的点击
次数,计算所述第一关键词的置信度,所述置信度用于表示所述第一关键词为
所述第一信息类型对应的关键词的置信程度;
如果所述第一关键词的置信度大于预设阈值,则将所述第一关键词确定为
所述第一信息类型对应的关键词。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
从当前搜索平台中存储的每个信息和第一搜索平台存储的历史搜索记录包
括的第一信息类型的信息中,获取属于预设类型的词,将所述获取的词确定为
所述第一信息类型对应的关键词;
其中,所述第一搜索平台为搜索平台中除所述当前搜索平台以外的任一搜
索平台,所述第一信息类型为所述信息类型集合中的任一信息类型。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取第一信息类型对应的关键词集合中包括的每个关键词的分词,以及获
取每个分词在所述关键词集合中出现的频次,将出现的频次满足预设条件的分
词确定为所述第一信息类型对应的关键词;
其中,所述第一信息类型为所述信息类型集合中的任一信息类型,所述关
键词集合包括所述第一信息类型对应的关键词。
5.如权利要求1至4任一项权利要求所述的方法,其特征在于,所述方法
还包括:
接收终端发送的关键词;
根据所述关键词,从所述信息关系列表中获取所述关键词对应的信息类型。
6.一种建立信息关系列表的装置,其特征在于,所述装置包...
【专利技术属性】
技术研发人员:郭朝楠,胡燊,王迪,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。