本发明专利技术提供了一种需求识别的方法和装置,其中方法包括:获取用户搜索请求(query);根据预先建立的需求强度识别策略确定所述用户query对应的预设服务的需求强度,如果不是无预设服务的需求,则进一步利用预先建立的模板与预设服务需求类别之间的对应关系确定所述用户query对应的预设服务需求类别。通过本发明专利技术能够识别出用户query对于某种服务的需求强度和需求类别,以便用于提高搜索结果的质量以及节约网络资源。
【技术实现步骤摘要】
—种需求识别的方法及装置
本专利技术涉及计算机
,特别涉及一种需求识别的方法及装置。背景技木在搜索技术中存在大量的垂直搜索需求,每ー类垂直搜索都存在与其对应的搜索需求,这就需要对用户搜索请求(query)进行需求识别。例如对于地图垂直搜索而言,现有的需求识别方法仅能够识别出用户query是否具有地图需求,对于有地图需求的用户query则在其捜索结果中加入地图垂直捜索的结 果。但不同用户query可能具有不同的地图需求強度和地图需求类别,现有技术中并没有对这些进行具体的识别和区分。例如,对于某些用户query而言,其地图需求强度较高,则用户可能希望能够在搜索结果中较快地获取到地图垂直捜索的结果;对于某些用户query而言,其地图需求强度不高,则用户可能没有很大的需求要获取地图垂直捜索的結果。如果用户输入不同的用户query来表达不同的需求类型,则希望能够尽快在搜索结果中获取到对应需求类型的展现形式。但这些在现有技术中均无法实现,从而造成捜索结果的质量较低,用户需要花费更多的时间和网络资源来获取想要的捜索結果。
技术实现思路
有鉴于此,本专利技术提供了一种需求识别的方法和装置,能够识别出用户query对于某种服务的需求強度和需求类别,以便用于提高捜索结果的质量以及节约网络资源。具体技术方案如下ー种需求识别的方法,该方法包括A、获取用户搜索请求query ;B、根据预先建立的需求强度识别策略确定所述用户query对应的预设服务的需求強度,如果不是无预设服务的需求,则进一歩利用预先建立的模板与预设服务需求类别之间的对应关系确定所述用户query对应的预设服务需求类别;其中所述需求強度识别策略包括以下识别策略中的至少ー种根据预设的模板与预设服务需求強度之间的对应关系进行预设服务需求强度的识别;将包含预设特征词的用户query识别为具有与该特征词所对应的预设服务需求強度;以及,根据预设模板和模板槽中的具体内容与预设服务需求強度之间的对应关系进行预设服务需求強度的识别。更进一歩地,在所述步骤A和步骤B之间还包括对所述用户query进行预处理;所述预处理包括转换为预设的大写形式或小写形式,或者,去掉预设的无意义符号。在所述步骤A和步骤B之间还可以包括判断所述用户query是否包含预先挖掘的黑名单词典中的词语,如果是,识别出所述用户query无预设服务的需求,结束流程;否则继续执行所述步骤B。如果所述预设服务为地图,则所述黑名单词典的挖掘具体包括S11、从搜索日志中获取因用户点击捜索结果而切換到预设服务页面的用户query,统计获取的各用户query的捜索次数和切換到预设服务页面的次数;S12、将用户query的捜索次数或者切換到预设服务页面的次数小于预设的过滤次数阈值的用户query从步骤Sll获取的用户query中过滤掉;S13、确定切換到预设服务页面的次数与捜索次数的比值小于预设黑名单比值的用户query ;S14、统计步骤S13确定的用户query中包含的词语在预先挖掘出的预设服务需求query中出现的次数,将统计的出现次数小于预设出现次数阈值的词语作为黑名单词构成 黑名单词典,或者,将统计的出现次数与所在用户query对应的所述比值的平均值小于预设的平均值阈值的用户query作为黑名单词构成黑名单词典。较优地,在所述步骤A和步骤B之间还包括将所述用户query与预先设置的odict词典进行匹配,如果匹配成功,则确定所述用户query的预设服务的需求強度和预设服务需求类别分别为在所述odict词典中匹配到的query对应的预设服务的需求強度和预设服务需求类别,结束流程;否则继续执行所述步骤B ;其中,所述odict词典包括搜索日志中高频出现的用户query对应的预设服务的需求强度和预设服务需求类别。如果预设服务为地图,则所述需求強度包括地图强需求、地图弱需求和无地图需求;所述需求类别包括普通地图需求、公交查询需求、线路查询需求和位置查询需求。如果预设服务为地图,则所述模板与预设服务的需求強度之间的对应关系包括模板,对应地图高强度需求;模板,对应地图高强度需求;模板,对应地图高强度需求;模板,对应地图高强度需求;模板,对应地图高强度需求;模板,对应地图高强度需求;模板,对应地图高强度需求;模板,对应地图弱强度需求;模板,对应地图弱强度需求;模板,对应地图弱强度需求;模板,对应地图弱强度需求;模板,对应地图弱强度需求;或者,模板,对应地图弱强度需求。如果所述预设服务为地图,则所述模板与预设服务需求类别之间的对应关系包括模板,对应公交查询需求;模板,对应线路查询需求;模板,对应线路查询需求;模板,对应位置查询需求;模板,对应位置查询需求;模板,对应位置查询需求;模板,对应位置查询需求;模板,对应普通地图需求;模板,对应普通地图需求;或者, 模板,对应普通地图需求。如果所述预设服务为地图,则预设的对应地图强需求的特征词包括“怎么走”、“地址”、“地图”或者“在哪”;预设的对应地图弱需求的特征词包括预先挖掘出的地图泛需求词。其中,所述地图泛需求词的挖掘具体包括S11、从搜索日志中获取用户query ;S12、利用地名词典确定包含地名的所述用户query ;S13、将所述步骤S12确定的用户query与包含地图泛需求词模板槽的种子模板进行匹配,确定用户query匹配到的地图泛需求词模板槽的内容作为泛需求词;S14、从所述泛需求词中确定地图泛需求词。所述步骤S14具体包括将所述泛需求词作为所述地图泛需求词;或者,所述步骤S14具体包括S14、利用所述步骤S12确定的用户query分别与种子query的核心向量的距离为所述步骤S12确定的用户query打分;S15、结合各泛需求词所属用户query的打分值、所属种子模板的质量以及种子模板的数目中的至少ー个,确定获取的各泛需求词的置信度,将置信度满足预设置信度要求的泛需求词作为地图泛需求词。所述地图需求query的挖掘具体包括S21、从搜索日志中获取因用户点击搜索结果而切换到地图页面的用户query,统计获取的各用户query的捜索次数和切換到地图页面的次数;S22、将用户query的捜索次数或者切換到地图页面的次数小于预设的过滤次数阈值的用户query从步骤S21获取的用户query中过滤掉;S23、确定切换到地图页面的次数与搜索次数的比值排在前NI个的用户query作为地图需求query,其中NI为预设的正整数。一种需求识别的装置,该装置包括请求获取单元,用于获取用户搜索请求query ;強度识别单元,用于根据预先建立的需求强度识别策略确定所述用户query对应的预设服务的需求強度;类别识别单元,用于在所述强度识别单元的识别结果不是无预设服务的需求吋,进ー步利用预先建立的模板与预设服务需求类别之间的对应关系确定所述用户query对应的预设服务需求类别;其中所述需求強度识别策略包括以下识别策略中的至少ー种根据预设的模板与预设服务需求強度之间的对应关系进行预设服务需求强度的识别;将包含预设特征词的用户query识别为具有与该特征词所对应的预设服务需求強度;以及,根据预设模板和模板槽中的具体内容与预设服务需求強度之间的对应关系进行需求强度的识别。更进一歩地,该装置还包括本文档来自技高网...
【技术保护点】
一种需求识别的方法,其特征在于,该方法包括:A、获取用户搜索请求query;B、根据预先建立的需求强度识别策略确定所述用户query对应的预设服务的需求强度,如果不是无预设服务的需求,则进一步利用预先建立的模板与预设服务需求类别之间的对应关系确定所述用户query对应的预设服务需求类别;其中所述需求强度识别策略包括以下识别策略中的至少一种:根据预设的模板与预设服务需求强度之间的对应关系进行预设服务需求强度的识别;将包含预设特征词的用户query识别为具有与该特征词所对应的预设服务需求强度;以及,根据预设模板和模板槽中的具体内容与预设服务需求强度之间的对应关系进行预设服务需求强度的识别。
【技术特征摘要】
【专利技术属性】
技术研发人员:施少杰,黄际洲,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。