一种词匹配及信息查询方法及装置制造方法及图纸

技术编号:2912184 阅读:283 留言:0更新日期:2012-04-11 18:40
本申请公开了一种词匹配及信息查询方法及装置,包括:获取输入的第一查询关键词;根据第一查询关键词获取用户反馈日志,所述用户反馈日志包括历次以所述第一查询关键词为目标进行查询的查询结果,以及历次用户对查询结果的点选频率;根据所述查询结果以及点选频率确定与第一查询关键词匹配的第二查询关键词;反馈以第二查询关键词为目标进行查询的查询结果。由于在本申请实施中采用了用户反馈日志作为发现用户查询信息潜在词义的基础,因此在拥有大量的数据情况下,能够利用以往的用户反馈信息准确的确定出查询信息的潜在词义,从而提高了信息查询的准确性。

【技术实现步骤摘要】

本申请涉及数据处理技术,特别涉及一种词匹配及信息查询方法及装置
技术介绍
潜在词义通常是指一个词(包括短语)潜在的意义,通常可以通过另外一 个或多个词(包括短语)来表达,比如通常所称的"冰箱,,其一般情况下潜在 的词义是指"电水箱",而"棉拖"其一般情况下潜在的词义是指"全棉拖鞋" 等。自动发现潜在词义是自然语言处理的一个基本问题,它的解决可以提高文 档理解、机器翻译和搜索引擎的效果和性能。分词技术是自然语言处理中常用的技术,分词是将一个输入字符串分成若 干个词或短语,比如"曾经有一段诚挚的感情摆在我的面前,,,经过分词处理 后,通常情况下得到的分词结果为"曾经l有l一段l诚挚l的l感情l摆在l我l的l面前"。用户反^t日志记录了查询词对应的查询结果(文档或网页ID等)和查询 结果点击频率、曝光频率等。点击频率、曝光频率等信息反应了用户对该查询 结果的认同程度, 一般意义上符合用户需求的文档点击率比不符合用户意图的 点击率要高,比如查"西药,,,结果"批发西药,,和"江西药厂"的单字的匹 配程度是一样的,但是通常第一个结果的点击率会比第二个结果要高。通过分析用户反馈日志可以发现本文档来自技高网...

【技术保护点】
一种计算机执行的词匹配方法,其特征在于,包括如下步骤: 获取待匹配词; 根据待匹配词获取用户反馈日志; 根据所述用户反馈日志确定与待匹配词匹配的词。

【技术特征摘要】

【专利技术属性】
技术研发人员:欧文武谢宇恒
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:VG[英属维尔京群岛]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1