一种搜索处理方法以及装置制造方法及图纸

技术编号:15840573 阅读:51 留言:0更新日期:2017-07-18 16:49
本发明专利技术实施例公开了一种搜索处理方法以及装置,其中方法包括:生成多个历史搜索字符串中每个历史搜索字符串分别对应的至少一个搜索字符变量句式,并对所生成的搜索字符变量句式中不属于常用搜索句式集合的搜索字符变量句式所对应的生成次数进行累计,并将生成次数达到预设的第一次数阈值的搜索字符变量句式添加至常用搜索句式集合中;当获取到当前搜索字符串时,将当前搜索字符串对应的至少一个搜索字符变量句式中属于常用搜索句式集合的搜索字符变量句式确定为目标搜索字符变量句式,并发送与目标搜索字符变量句式对应的搜索结果数据到客户端。采用本发明专利技术,可提高对搜索字符串的识别准确度,以保证搜索结果可以满足用户期望。

Search processing method and device

The embodiment of the invention discloses a search processing method and device, wherein the method comprises the following steps: generating a plurality of historical search string each historical search string corresponding to the at least one search character variable sentence, and the sentence generated search character variable is not generated number corresponding to search character variables in common search sentence sentence the set of the cumulative number of times will be generated and reached the first preset threshold search character variable sentence added to the commonly used search sentence sets; when access to the current search string, when the former will belong to the search string corresponding to the at least one search character variable sentence sentence set commonly used search search patterns identified as the character variable the search target character variable sentence, and sends it to the target search character variable sentence corresponding to the search results to the data Client\u3002 The invention can improve the recognition accuracy of the search string so as to ensure that the search result can satisfy the user expectation.

【技术实现步骤摘要】
一种搜索处理方法以及装置
本专利技术涉及互联网
,尤其涉及一种搜索处理方法以及装置。
技术介绍
随着互联网和电子设备的发展,越来越多用户会选择通过互联网搜索歌曲进行收听,例如,用户通过客户端在搜索栏中输入“刘德华”时,服务器将会反馈各种与“刘德华”相关的歌曲信息到该客户端,可见通过互联网搜索歌曲可以使用户更方便听到各式各样的歌曲。但是当用户所输入的搜索字符串带有一些口语化时,目前的歌曲搜索方式将无法准确识别该搜索字符串,从而导致所搜索到的歌曲信息不能完全符合用户的期望。例如,若用户输入的搜索字符串为“我要找张国荣的红”,则目前的歌曲搜索方式将会识别出“我”和“红”都是张国荣的歌曲,而且歌曲“我”的点击量要比歌曲“红”更高,即歌曲“我”的优先级更高,因此,通过目前的歌曲搜索方式将会把歌曲“我”输出给用户,但显然用户找的不是歌曲“我”,而是歌曲“红”,由此可见,目前的歌曲搜索方式将无法准确识别该搜索字符串。
技术实现思路
本专利技术实施例提供一种搜索处理方法以及装置,可提高对搜索字符串的识别准确度,以保证搜索结果可以满足用户期望。本专利技术实施例提供了一种搜索处理方法,包括:在达到预设的第一时间间隔时,获取在所述第一时间间隔内所收集到的多个历史搜索字符串;根据预设的搜索字符变量集合生成所述多个历史搜索字符串中每个历史搜索字符串分别对应的至少一个搜索字符变量句式,并对所生成的搜索字符变量句式中不属于预设的常用搜索句式集合的搜索字符变量句式所对应的生成次数进行累计,并将所述生成次数达到预设的第一次数阈值的搜索字符变量句式添加至所述常用搜索句式集合中;当获取到客户端发送的当前搜索字符串时,将所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式确定为目标搜索字符变量句式,并发送与所述目标搜索字符变量句式对应的搜索结果数据到所述客户端。相应地,本专利技术实施例还提供了一种搜索处理装置,包括:第一获取模块,用于在达到预设的第一时间间隔时,获取在所述第一时间间隔内所收集到的多个历史搜索字符串;句式处理模块,用于根据预设的搜索字符变量集合生成所述多个历史搜索字符串中每个历史搜索字符串分别对应的至少一个搜索字符变量句式,并对所生成的搜索字符变量句式中不属于预设的常用搜索句式集合的搜索字符变量句式所对应的生成次数进行累计,并将所述生成次数达到预设的第一次数阈值的搜索字符变量句式添加至所述常用搜索句式集合中;确定发送模块,用于当获取到客户端发送的当前搜索字符串时,将所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式确定为目标搜索字符变量句式,并发送与所述目标搜索字符变量句式对应的搜索结果数据到所述客户端。本专利技术实施例在达到预设的第一时间间隔时,通过获取在所述第一时间间隔内所收集到的多个历史搜索字符串,可以根据预设的搜索字符变量集合生成所述多个历史搜索字符串中每个历史搜索字符串分别对应的至少一个搜索字符变量句式,并对所生成的搜索字符变量句式中不属于预设的常用搜索句式集合的搜索字符变量句式所对应的生成次数进行累计,并将所述生成次数达到预设的第一次数阈值的搜索字符变量句式添加至所述常用搜索句式集合中,以保证所述常用搜索句式集合中的搜索字符变量句式都是经常被使用到的句式,即说明所述常用搜索句式集合中的搜索字符变量句式都是更加贴合用户意图的句式,因此,当获取到客户端发送的当前搜索字符串时,可以将所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式确定为目标搜索字符变量句式,并发送与所述目标搜索字符变量句式对应的搜索结果数据到所述客户端,由于所述目标搜索字符变量句式为最贴合用户意图的句式,所以可以提高对当前搜索字符串的识别准确度,以保证搜索结果可以满足用户期望。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种搜索处理方法的流程示意图;图2是本专利技术实施例提供的另一种搜索处理方法的流程示意图;图3是本专利技术实施例提供的其中一种句式处理方法的流程示意图;图4是本专利技术实施例提供的一种搜索处理装置的结构示意图;图5是本专利技术实施例提供的一种句式处理模块的结构示意图;图6是本专利技术实施例提供的一种确定发送模块的结构示意图;图7是本专利技术实施例提供的另一种搜索处理装置的结构示意图;图8是本专利技术实施例提供的又一种搜索处理装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参见图1,是本专利技术实施例提供的一种搜索处理方法的流程示意图,所述方法可以包括:S101,在达到预设的第一时间间隔时,获取在所述第一时间间隔内所收集到的多个历史搜索字符串;具体的,服务器可以在达到预设的第一时间间隔时,获取在所述第一时间间隔内所收集到的多个历史搜索字符串,所述多个历史搜索字符串可以指所有客户端在所述第一时间间隔内所输入并上传的所有用户搜索语料。例如,若所述第一时间间隔设为1天,则所述服务器将每天获取一次当天内收集到的所述多个历史搜索字符串。S102,根据预设的搜索字符变量集合生成所述多个历史搜索字符串中每个历史搜索字符串分别对应的至少一个搜索字符变量句式,并对所生成的搜索字符变量句式中不属于预设的常用搜索句式集合的搜索字符变量句式所对应的生成次数进行累计,并将所述生成次数达到预设的第一次数阈值的搜索字符变量句式添加至所述常用搜索句式集合中;具体的,所述搜索字符变量集合可以包括至少一个字符变量,且每个字符变量分别包括与对应字符变量相关联的搜索字符。例如,所述搜索字符变量集合所包括的字符变量分别为“%歌手%”、“%歌曲%”、“%要%”、“%的%”、“%前缀%”、“%后缀%”;字符变量“%歌手%”所包括的搜索字符可以为后台音乐曲库中的全部歌手名字;字符变量“%歌曲%”所包括的搜索字符可以为后台音乐曲库中的全部歌曲名称;字符变量“%要%”所包括的搜索字符可以分别为:“我要找”、“要找”、“要搜索”等词语,这些搜索字符的语义均与字符变量“%要%”相接近;字符变量“%的%”所包括的搜索字符可以分别为:“的”、“和”等等,这些搜索字符的语义均与字符变量“%的%”相接近;字符变量“%前缀%”所包括的搜索字符可以分别为:“你好”、“麻烦”等等,这些搜索字符的语义均与字符变量“%前缀%”相接近;字符变量“%后缀%”所包括的搜索字符可以分别为:“谢谢”、“多谢”等等,这些搜索字符的语义均与字符变量“%后缀%”相接近。因此,所述服务器可以根据所述搜索字符变量集合中各字符变量所包括的搜索字符对所述多个历史搜索字符串进行识别,以分别将每个历史搜索字符串拆分为至少一个分词字符,并根据所述每个历史搜索字符串的所本文档来自技高网...
一种搜索处理方法以及装置

【技术保护点】
一种搜索处理方法,其特征在于,包括:在达到预设的第一时间间隔时,获取在所述第一时间间隔内所收集到的多个历史搜索字符串;根据预设的搜索字符变量集合生成所述多个历史搜索字符串中每个历史搜索字符串分别对应的至少一个搜索字符变量句式,并对所生成的搜索字符变量句式中不属于预设的常用搜索句式集合的搜索字符变量句式所对应的生成次数进行累计,并将所述生成次数达到预设的第一次数阈值的搜索字符变量句式添加至所述常用搜索句式集合中;当获取到客户端发送的当前搜索字符串时,将所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式确定为目标搜索字符变量句式,并发送与所述目标搜索字符变量句式对应的搜索结果数据到所述客户端。

【技术特征摘要】
1.一种搜索处理方法,其特征在于,包括:在达到预设的第一时间间隔时,获取在所述第一时间间隔内所收集到的多个历史搜索字符串;根据预设的搜索字符变量集合生成所述多个历史搜索字符串中每个历史搜索字符串分别对应的至少一个搜索字符变量句式,并对所生成的搜索字符变量句式中不属于预设的常用搜索句式集合的搜索字符变量句式所对应的生成次数进行累计,并将所述生成次数达到预设的第一次数阈值的搜索字符变量句式添加至所述常用搜索句式集合中;当获取到客户端发送的当前搜索字符串时,将所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式确定为目标搜索字符变量句式,并发送与所述目标搜索字符变量句式对应的搜索结果数据到所述客户端。2.如权利要求1所述的方法,其特征在于,所述搜索字符变量集合包括至少一个字符变量,且每个字符变量分别包括与对应字符变量相关联的搜索字符;所述根据预设的搜索字符变量集合生成所述多个历史搜索字符串中每个历史搜索字符串分别对应的至少一个搜索字符变量句式,并对所生成的搜索字符变量句式中不属于预设的常用搜索句式集合的搜索字符变量句式所对应的生成次数进行累计,并将所述生成次数达到预设的第一次数阈值的搜索字符变量句式添加至所述常用搜索句式集合中,包括:根据所述搜索字符变量集合中的所述搜索字符对所述多个历史搜索字符串进行识别,以分别将每个历史搜索字符串拆分为至少一个分词字符;将所述多个历史搜索字符串中所述至少一个分词字符均存在对应的字符变量的历史搜索字符串确定为第一类历史搜索字符串;根据所述第一类历史搜索字符串对应的每个字符变量,生成所述第一类历史搜索字符串对应的至少一个由所述每个字符变量构成的为全变量类型的搜索字符变量句式;对所生成的搜索字符变量句式中不属于预设的常用搜索句式集合且为全变量类型的搜索字符变量句式所对应的生成次数进行累计,并将所述生成次数达到预设的第一次数阈值且为所述全变量类型的搜索字符变量句式添加至所述常用搜索句式集合中。3.如权利要求2所述的方法,其特征在于,还包括:将所述多个历史搜索字符串中所述至少一个分词字符不是均存在对应的字符变量的历史搜索字符串确定为第二类历史搜索字符串,并将所述第二类历史搜索字符串中不存在对应的字符变量的分词字符确定为第一分词字符,并将所述第二类历史搜索字符串中存在对应的字符变量的分词字符确定为第二分词字符;生成所述第二类历史搜索字符串对应的至少一个由所述第一分词字符以及所述第二分词字符对应的字符变量构成的为非全变量类型的搜索字符变量句式;对至少一个为所述非全变量类型的搜索字符变量句式分别对应的生成次数进行累计,并在所述至少一个为所述非全变量类型的搜索字符变量句式中存在所述生成次数达到预设的第二次数阈值的搜索字符变量句式时,将所述第一分词字符添加至已有的字符变量或新创建的字符变量中;生成所述第二类历史搜索字符串对应的至少一个由所述第一分词字符对应的字符变量以及所述第二分词字符对应的字符变量构成的为所述全变量类型的搜索字符变量句式,并重新执行所述对所生成的搜索字符变量句式中不属于预设的常用搜索句式集合且为全变量类型的搜索字符变量句式所对应的生成次数进行累计,并将所述生成次数达到预设的第一次数阈值且为所述全变量类型的搜索字符变量句式添加至所述常用搜索句式集合中。4.如权利要求1所述的方法,其特征在于,所述当获取到客户端发送的当前搜索字符串时,将所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式确定为目标搜索字符变量句式,并发送与所述目标搜索字符变量句式对应的搜索结果数据到所述客户端,包括:当获取到客户端发送的当前搜索字符串时,根据所述搜索字符变量集合生成所述当前搜索字符串对应的至少一个搜索字符变量句式;检测所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式的数量;当检测到所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式的数量为一个时,将所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式确定为目标搜索字符变量句式,并发送与所述目标搜索字符变量句式对应的搜索结果数据到所述客户端。5.如权利要求4所述的方法,其特征在于,还包括:当检测到所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式的数量为零时,将所述当前搜索字符串对应的至少一个搜索字符变量句式中具有最多生成次数的搜索字符变量句式确定为目标搜索字符变量句式,并发送与所述目标搜索字符变量句式对应的搜索结果数据到所述客户端;当检测到所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的搜索字符变量句式的数量大于一个时,获取所述当前搜索字符串对应的至少一个搜索字符变量句式中属于所述常用搜索句式集合的多个搜索字符变量句式分别对应的热度排行信息,并根据所述热度排行信息将具有最高热度排行的搜索字符变量句式确定为目标搜索字符变量句式,并发送与所述目标搜索字符变量句式对应的搜索结果数据到所述客户端。6.如权利要求1所述的方法,其特征在于,还包括:当达到预设的第二时间间隔时,获取所述常用搜索句式集合和预设的待定句式集合中的所有搜索字符变量句式;所述待定句式集合是用于存储未被添加至所述常用搜索句式集合的搜索字符变量句式;根据在所述第二时间间隔内所收集到的所有历史搜索字符串,重新统计所述所有搜索字符变量句式中每个搜索字符变量句式所对应的新生成次数,并将所...

【专利技术属性】
技术研发人员:傅鸿城
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1