一种搜索词的提取方法及装置制造方法及图纸

技术编号:9462810 阅读:91 留言:0更新日期:2013-12-19 00:03
本发明专利技术涉及一种搜索词提取方法,其包括:提供待提取搜索词的文档Doci;从文档Doci中提取搜索词;计算搜索词的主题相关性;以及根据搜索词的主题相关性对搜索词进行过滤。上述搜索词提取方法可以解决现有技术中搜索词主题漂移、词义太过宽泛的问题。此外,本发明专利技术还提供一种搜索词提取装置。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及一种搜索词提取方法,其包括:提供待提取搜索词的文档Doci;从文档Doci中提取搜索词;计算搜索词的主题相关性;以及根据搜索词的主题相关性对搜索词进行过滤。上述搜索词提取方法可以解决现有技术中搜索词主题漂移、词义太过宽泛的问题。此外,本专利技术还提供一种搜索词提取装置。【专利说明】一种搜索词的提取方法及装置
本专利技术涉及网络搜索技术,尤其涉及一种搜索词的提取方法及装置。
技术介绍
用户在浏览新闻、微博、博客时,在聊天时,在网上购物时,都时刻有搜索的需求。所谓情境搜索,就是理解用户意图,挖掘用户需求,让搜索更加智能化、生活化。以用户在浏览网页为例进行说明,如果能直接在网页中提供最符合用户需求的搜索链接,用户可以直接点击链接继续浏览而无须手动输入搜索词进行搜索,这无疑会极大的提升用户的浏览体验。现有技术中也进行了相关的探索与实践,大体上来说,现有的搜索词提供方式具有以下三种:一、在生成数据时,由数据生成者手工设定搜索词。例如:在blog中,用户写完blog后。自己添加一些标签词,作为搜索词。在新闻发布时,由编辑手动添加关键词,作为搜索词。然而,此种方本文档来自技高网...
一种搜索词的提取方法及装置

【技术保护点】
一种搜索词提取方法,包括:提供待提取搜索词的文档Doci;从文档Doci中提取搜索词;计算所述搜索词的主题相关性;根据搜索词的主题相关性对所述搜索词进行过滤。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘怀军
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1