文件推荐方法和装置制造方法及图纸

技术编号:11590400 阅读:82 留言:0更新日期:2015-06-10 23:08
本发明专利技术公开了一种文件推荐方法和装置,属于网络技术领域。所述方法包括:对第一名称进行分词得到第一关键词集合;根据预设对应关系,获取至少一个第二名称和第二关键词集合,所述预设对应关系包括关键词与包含所述关键词的文件名称之间的对应关系;获取所述第一关键词集合和每个第二名称对应的第二关键词集合中相同的关键词作为匹配关键词;获取所述每个第二名称包括的匹配关键词在所述第一名称中的权重;确定待推荐的第二名称;推荐所述确定的第二名称所指示的文件。本发明专利技术通过根据匹配关键词的词性确定权重,根据权重从多个备选的第二名称中确定待推荐的第二名称,提高了最终推荐的文件名称与当前打开文件的名称的相关度,提高了推荐成功率。

【技术实现步骤摘要】

本专利技术涉及网络
,特别涉及一种文件推荐方法和装置
技术介绍
在日常的线上活动中,用户时时刻刻都在面对着各种各样的信息,但却很难从中筛选出自己真正感兴趣的信息。为了便于用户的筛选,服务器可以根据用户的浏览记录、兴趣爱好等,为用户推荐其可能感兴趣的信息。以视频为例,在推荐视频时,服务器可以为用户推荐当前播放视频所属的类型下最热门的视频,如,当前播放视频为“体育”类型的视频时,服务器为用户推荐“体育”类型下最热门的视频。或者,服务器计算每个视频的名称与当前播放视频的名称之间的LD(Levenshtein Distance,编辑距离),将名称与当前播放视频的名称之间的LD距离最小的视频推荐给用户。推荐当前播放视频所属的类型下最热门的视频时,该最热门的视频与当前播放视频的相关度可能很低,进而导致推荐成功率低;而服务器采用计算LD距离的方法推荐视频时,LD距离只能机械地度量不同视频名称之间文字编辑层面的差异,使得最终确定推荐的视频名称与当前播放视频名称在语义上可能相差...

【技术保护点】
一种文件推荐方法,其特征在于,所述方法包括:对第一名称进行分词,得到第一关键词集合,所述第一名称为当前打开文件的名称,所述第一关键词集合包括所述第一名称分词得到的至少一个关键词;根据预设对应关系,获取至少一个第二名称和所述至少一个第二名称对应的第二关键词集合,所述第二名称为所述第一关键词集合中的关键词对应的文件名称,所述预设对应关系包括关键词与包含所述关键词的文件名称之间的对应关系;获取所述第一关键词集合和每个第二名称对应的第二关键词集合中相同的关键词,将所述相同的关键词作为匹配关键词;获取所述每个第二名称包括的匹配关键词在所述第一名称中的权重;根据所述每个第二名称包括的匹配关键词在所述第一名...

【技术特征摘要】
1.一种文件推荐方法,其特征在于,所述方法包括:
对第一名称进行分词,得到第一关键词集合,所述第一名称为当前打开文
件的名称,所述第一关键词集合包括所述第一名称分词得到的至少一个关键词;
根据预设对应关系,获取至少一个第二名称和所述至少一个第二名称对应
的第二关键词集合,所述第二名称为所述第一关键词集合中的关键词对应的文
件名称,所述预设对应关系包括关键词与包含所述关键词的文件名称之间的对
应关系;
获取所述第一关键词集合和每个第二名称对应的第二关键词集合中相同的
关键词,将所述相同的关键词作为匹配关键词;
获取所述每个第二名称包括的匹配关键词在所述第一名称中的权重;
根据所述每个第二名称包括的匹配关键词在所述第一名称中的权重,确定
待推荐的第二名称;
推荐所述确定的第二名称所指示的文件。
2.根据权利要求1所述的方法,其特征在于,根据预设对应关系,获取至
少一个第二名称和所述至少一个第二名称对应的第二关键词集合包括:
根据所述预设对应关系,获取所述至少一个第二名称;
对于所述至少一个第二名称中的每个第二名称,对所述第二名称进行分词,
得到第二关键词集合,所述第二关键词集合包括所述第二名称分词得到的至少
一个关键词。
3.根据权利要求1所述的方法,其特征在于,获取所述每个第二名称包括
的匹配关键词在所述第一名称中的权重之前,所述方法还包括:
根据所述第一关键词集合中每个关键词的类型和出现频率中的至少一项,

\t获取所述每个关键词在所述第一名称中的权重。
4.根据权利要求3所述的方法,其特征在于,根据所述第一关键词集合中
每个关键词的类型和出现频率中的至少一项,获取所述每个关键词在所述第一
名称中的权重包括:
根据所述每个关键词的类型对应的权重级别,按照权重级别从高到低的顺
序为所述每个关键词分配权重,使得权重级别高的关键词所分配的权重大于权
重级别低的关键词所分配的权重;或,
按照所述每个关键词的出现频率从高到低的顺序为所述每个关键词分配权
重,使得出现频率高的关键词所分配的权重大于出现频率低的关键词所分配的
权重;或,
根据所述每个关键词的类型对应的权重级别,按照权重级别从高到低的顺
序为所述每个关键词分配权重,使得权重级别高的关键词所分配的权重大于权
重级别低的关键词所分配的权重;
根据所述每个关键词的出现频率,对所述每个关键词所分配的权重进行调
整。
5.根据权利要求3所述的方法,其特征在于,所述关键词的类型包括名词、
动词或虚词,名词的权重级别高于动词和虚词的权重级别;
所述关键词的出现频率为所述关键词在已存储的文件名称中出现的频率,
或者,所述关键词的出现频率为所述关键词在已存储的指定类别的文件名称中
出现的频率,所述指定类别为所述当前打开文件所属的类别。
6.根据权利要求5所述的方法,其特征在于,名词中姓名的权重级别高于
其他名词的权重级别。
7.根据权利要求1所述的方法,其特征在于,根据所述每个第二名称包括
的匹配关键词在所述第一名称中的权重,确定待推荐的第二名称包括:
根据所述每个第二名称包括的匹配关键词在所述第一名称中的权重,确定
所述每个第二名称的权重;
按照所述每个第二名称的权重从大到小的顺序,将预设数目的第二名称确
定为所述待推荐的第二名称。
8.根据权利要求7所述的方法,其特征在于,根据所述每个第二名称包括
的匹配关键词在所述第一名称中的权重,确定所述每个第二名称的权重包括:
将所述每个第二名称包括的匹配关键词在所述第一名称中的权重的和值确
定为所述每个第二名称的权重;或,
根据所述每个第二名称所指示文件的发布时间,确定所述每个第二名称的
时间权重,按照预设比例,对所述每个第二名称包括的匹配关键词在所述第一
名称中的权重的和值以及所述时间权重进行加权计算,得到加权和值,将所述
加权和值确定为所述每个第二名称的权...

【专利技术属性】
技术研发人员:尹程果
申请(专利权)人:深圳市腾讯计算机系统有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1