The embodiment of the invention discloses a search processing method and device, wherein the method comprises the following steps: generating a plurality of historical search string each historical search string corresponding to the at least one search character variable sentence, and the sentence generated search character variable is not generated number corresponding to search character variables in common search sentence sentence the set of the cumulative number of times will be generated and reached the first preset threshold search character variable sentence added to the commonly used search sentence sets; when access to the current search string, when the former will belong to the search string corresponding to the at least one search character variable sentence sentence set commonly used search search patterns identified as the character variable the search target character variable sentence, and sends it to the target search character variable sentence corresponding to the search results to the data Client\u3002 The invention can improve the recognition accuracy of the search string so as to ensure that the search result can satisfy the user expectation.
【技术实现步骤摘要】
一种搜索处理方法以及装置
本专利技术涉及互联网
,尤其涉及一种搜索处理方法以及装置。
技术介绍
随着互联网和电子设备的发展,越来越多用户会选择通过互联网搜索歌曲进行收听,例如,用户通过客户端在搜索栏中输入“刘德华”时,服务器将会反馈各种与“刘德华”相关的歌曲信息到该客户端,可见通过互联网搜索歌曲可以使用户更方便听到各式各样的歌曲。但是当用户所输入的搜索字符串带有一些口语化时,目前的歌曲搜索方式将无法准确识别该搜索字符串,从而导致所搜索到的歌曲信息不能完全符合用户的期望。例如,若用户输入的搜索字符串为“我要找张国荣的红”,则目前的歌曲搜索方式将会识别出“我”和“红”都是张国荣的歌曲,而且歌曲“我”的点击量要比歌曲“红”更高,即歌曲“我”的优先级更高,因此,通过目前的歌曲搜索方式将会把歌曲“我”输出给用户,但显然用户找的不是歌曲“我”,而是歌曲“红”,由此可见,目前的歌曲搜索方式将无法准确识别该搜索字符串。
技术实现思路
本专利技术实施例提供一种搜索处理方法以及装置,可提高对搜索字符串的识别准确度,以保证搜索结果可以满足用户期望。本专利技术实施例提供了一种搜索处理方法,包括:在达到预设的第一时间间隔时,获取在所述第一时间间隔内所收集到的多个历史搜索字符串;根据预设的搜索字符变量集合生成所述多个历史搜索字符串中每个历史搜索字符串分别对应的至少一个搜索字符变量句式,并对所生成的搜索字符变量句式中不属于预设的常用搜索句式集合的搜索字符变量句式所对应的生成次数进行累计,并将所述生成次数达到预设的第一次数阈值的搜索字符变量句式添加至所述常用搜索句式集合中;当获取到客户 ...
【技术保护点】
一种搜索处理方法,其特征在于,包括:在达到预设的第一时间间隔时,获取在所述第一时间间隔内所收集到的多个历史搜索字符串;根据预设的搜索字符变量集合生成所述多个历史搜索字符串中每个历史搜索字符串分别对应的至少一个搜索字符变量句式,并对所生成的搜索字符变量句式中不属于预设的常用搜索句式集合的搜索字符变量句式所对应的生成次数进行累计,并将所述生成次数达到预设的第一次数阈值的搜索字符变量句式添加至所述常用搜索句式集合中;当获取到客户端发送的当前搜索字符串时,将所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式确定为目标搜索字符变量句式,并发送与所述目标搜索字符变量句式对应的搜索结果数据到所述客户端。
【技术特征摘要】
1.一种搜索处理方法,其特征在于,包括:在达到预设的第一时间间隔时,获取在所述第一时间间隔内所收集到的多个历史搜索字符串;根据预设的搜索字符变量集合生成所述多个历史搜索字符串中每个历史搜索字符串分别对应的至少一个搜索字符变量句式,并对所生成的搜索字符变量句式中不属于预设的常用搜索句式集合的搜索字符变量句式所对应的生成次数进行累计,并将所述生成次数达到预设的第一次数阈值的搜索字符变量句式添加至所述常用搜索句式集合中;当获取到客户端发送的当前搜索字符串时,将所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式确定为目标搜索字符变量句式,并发送与所述目标搜索字符变量句式对应的搜索结果数据到所述客户端。2.如权利要求1所述的方法,其特征在于,所述搜索字符变量集合包括至少一个字符变量,且每个字符变量分别包括与对应字符变量相关联的搜索字符;所述根据预设的搜索字符变量集合生成所述多个历史搜索字符串中每个历史搜索字符串分别对应的至少一个搜索字符变量句式,并对所生成的搜索字符变量句式中不属于预设的常用搜索句式集合的搜索字符变量句式所对应的生成次数进行累计,并将所述生成次数达到预设的第一次数阈值的搜索字符变量句式添加至所述常用搜索句式集合中,包括:根据所述搜索字符变量集合中的所述搜索字符对所述多个历史搜索字符串进行识别,以分别将每个历史搜索字符串拆分为至少一个分词字符;将所述多个历史搜索字符串中所述至少一个分词字符均存在对应的字符变量的历史搜索字符串确定为第一类历史搜索字符串;根据所述第一类历史搜索字符串对应的每个字符变量,生成所述第一类历史搜索字符串对应的至少一个由所述每个字符变量构成的为全变量类型的搜索字符变量句式;对所生成的搜索字符变量句式中不属于预设的常用搜索句式集合且为全变量类型的搜索字符变量句式所对应的生成次数进行累计,并将所述生成次数达到预设的第一次数阈值且为所述全变量类型的搜索字符变量句式添加至所述常用搜索句式集合中。3.如权利要求2所述的方法,其特征在于,还包括:将所述多个历史搜索字符串中所述至少一个分词字符不是均存在对应的字符变量的历史搜索字符串确定为第二类历史搜索字符串,并将所述第二类历史搜索字符串中不存在对应的字符变量的分词字符确定为第一分词字符,并将所述第二类历史搜索字符串中存在对应的字符变量的分词字符确定为第二分词字符;生成所述第二类历史搜索字符串对应的至少一个由所述第一分词字符以及所述第二分词字符对应的字符变量构成的为非全变量类型的搜索字符变量句式;对至少一个为所述非全变量类型的搜索字符变量句式分别对应的生成次数进行累计,并在所述至少一个为所述非全变量类型的搜索字符变量句式中存在所述生成次数达到预设的第二次数阈值的搜索字符变量句式时,将所述第一分词字符添加至已有的字符变量或新创建的字符变量中;生成所述第二类历史搜索字符串对应的至少一个由所述第一分词字符对应的字符变量以及所述第二分词字符对应的字符变量构成的为所述全变量类型的搜索字符变量句式,并重新执行所述对所生成的搜索字符变量句式中不属于预设的常用搜索句式集合且为全变量类型的搜索字符变量句式所对应的生成次数进行累计,并将所述生成次数达到预设的第一次数阈值且为所述全变量类型的搜索字符变量句式添加至所述常用搜索句式集合中。4.如权利要求1所述的方法,其特征在于,所述当获取到客户端发送的当前搜索字符串时,将所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式确定为目标搜索字符变量句式,并发送与所述目标搜索字符变量句式对应的搜索结果数据到所述客户端,包括:当获取到客户端发送的当前搜索字符串时,根据所述搜索字符变量集合生成所述当前搜索字符串对应的至少一个搜索字符变量句式;检测所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式的数量;当检测到所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式的数量为一个时,将所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式确定为目标搜索字符变量句式,并发送与所述目标搜索字符变量句式对应的搜索结果数据到所述客户端。5.如权利要求4所述的方法,其特征在于,还包括:当检测到所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式的数量为零时,将所述当前搜索字符串对应的至少一个搜索字符变量句式中具有最多生成次数的搜索字符变量句式确定为目标搜索字符变量句式,并发送与所述目标搜索字符变量句式对应的搜索结果数据到所述客户端;当检测到所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式的数量大于一个时,获取所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的多个搜索字符变量句式分别对应的热度排行信息,并根据所述热度排行信息将具有最高热度排行的搜索字符变量句式确定为目标搜索字符变量句式,并发送与所述目标搜索字符变量句式对应的搜索结果数据到所述客户端。6.如权利要求1所述的方法,其特征在于,还包括:当达到预设的第二时间间隔时,获取所述常用搜索句式集合和预设的待定句式集合中的所有搜索字符变量句式;所述待定句式集合是用于存储未被添加至所述常用搜索句式集合的搜索字符变量句式;根据在所述第二时间间隔内所收集到的所有历史搜索字符串,重新统计所述所有搜索字符变量句式中每个搜索字符变量句式所对应的新生成次数,并将所...
【专利技术属性】
技术研发人员:傅鸿城,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。