【技术实现步骤摘要】
本申请涉及数据处理技术,特别涉及一种词匹配及信息查询方法及装置。
技术介绍
潜在词义通常是指一个词(包括短语)潜在的意义,通常可以通过另外一 个或多个词(包括短语)来表达,比如通常所称的"冰箱,,其一般情况下潜在 的词义是指"电水箱",而"棉拖"其一般情况下潜在的词义是指"全棉拖鞋" 等。自动发现潜在词义是自然语言处理的一个基本问题,它的解决可以提高文 档理解、机器翻译和搜索引擎的效果和性能。分词技术是自然语言处理中常用的技术,分词是将一个输入字符串分成若 干个词或短语,比如"曾经有一段诚挚的感情摆在我的面前,,,经过分词处理 后,通常情况下得到的分词结果为"曾经l有l一段l诚挚l的l感情l摆在l我l的l面前"。用户反^t日志记录了查询词对应的查询结果(文档或网页ID等)和查询 结果点击频率、曝光频率等。点击频率、曝光频率等信息反应了用户对该查询 结果的认同程度, 一般意义上符合用户需求的文档点击率比不符合用户意图的 点击率要高,比如查"西药,,,结果"批发西药,,和"江西药厂"的单字的匹 配程度是一样的,但是通常第一个结果的点击率会比第二个结果要高。通过分析 ...
【技术保护点】
一种计算机执行的词匹配方法,其特征在于,包括如下步骤: 获取待匹配词; 根据待匹配词获取用户反馈日志; 根据所述用户反馈日志确定与待匹配词匹配的词。
【技术特征摘要】
【专利技术属性】
技术研发人员:欧文武,谢宇恒,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:VG[英属维尔京群岛]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。