一种查询串的同义变换方法及设备技术

技术编号：13183734 阅读：40 留言：0更新日期：2016-05-11 15:18

本发明专利技术提供一种查询串的同义变换方法及设备，包括：将查询串进行分词处理，得到分词片段；以分词片段为单元利用正向最大匹配算法在预置的词库中对查询串进行同义词查询；用查询到的同义词替换查询串中对应的分词片段得到多个同义串；对每个同义串进行需求满意度统计，获得每个同义串的需求满意度值；对同义串按照需求满意度值由大到小的顺序进行排序；将排序在前的n个同义串作为同义变换后的查询串，n为预置的需要反馈的同义串个数。由于正向最大匹配算法是优先匹配最长的同义词，得到的同义串可以更符合用户的表达习惯，并且能够最大程度地减少语义偏移。由于需求满意度值较高的同义串更符合用户的查询意图，这样反馈的同义串更加准确。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及搜索
，特别涉及一种查询串的同义变换方法及设备。
技术介绍
目前，地址搜索已经是人们生活中经常使用的一种搜索方式，例如，搜索酒店、饭店以及购物中心等。这样人们在出行前或出行中可以实现对目的地的路线规划。但是，不同用户针对同一事物的称呼有所区别，例如，用户输入的查询串为"方恒国际大厦"，而在搜索引擎对应的数据库中只有名称为"方恒国际中心"的兴趣点数据，由此可见，虽然用户输入的查询串为"方恒国际大厦"，但其实际期望查询的是"方恒国际中心"，因此，搜索引擎有必要对用户输入的查询串进行同义变换，将用户输入的查询串变换为数据库中可能存在的查询串，同时利用用户输入的查询串和同义变换得到的查询串进行搜索，以便快速准确地得到用户期望的搜索结果。目前搜索引擎对查询串进行同义变换的方法是基于词典，参见图1，具体方法包括以下步骤： S101 :对用户输入的查询串进行分词处理，得到所述查询串的分词片段；例如，"方恒国际中心"的分词片段为"方/恒/国际/中心/"。 S102 :基于同义词词典，查找分词片段的同义词； S103:如果查找到分词片段的同义词，则用该分词片段的同义词替换查询串中对应分词片段，否则，进入步骤104 ; S104:判断分词片段是否为最后一个分词片段，如果是，则将同义词替换得到的查询串作为结果输出，否则返回步骤102。需要说明的是，分词片段从左至右依次为第一个到最后一个，例如"方"为第一个分词片段，"中心"为最后一个分词片段。现有技术中的查询串同义变换方法仅是用每个分词片段的同义词替换原查询串中的...

【技术保护点】
一种查询串的同义变换方法，其特征在于，包括：将查询串进行分词处理，得到分词片段；以分词片段为单元利用正向最大匹配算法在预置的词库中对所述查询串进行同义词查询；用查询到的同义词替换查询串中对应的分词片段得到多个同义串；对每个所述同义串进行需求满意度统计，获得每个同义串的需求满意度值；对同义串按照需求满意度值由大到小的顺序进行排序；将排序在前的n个同义串作为同义变换后的查询串，所述n为预置的需要反馈的同义串个数，n为整数。

【技术特征摘要】

【专利技术属性】
技术研发人员：王思聪，
申请(专利权)人：高德软件有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人