本申请公开了一种搜索需求识别方法及装置。一种搜索需求识别方法包括:预先建立语言模型;接收到搜索请求后,利用所述语言模型得到搜索关键词对应的语言模型概率;根据所述搜索关键词的语言模型概率,判断所述搜索请求是否具有翻译需求。应用本申请实施例所提供的方案,可以不要求用户在搜索时输入“翻译”或“是什么意思”等明确表示翻译需求的关键词,直接确定用户所输入的内容是否具有翻译需求并给出翻译结果,从而提高了翻译需求识别的应用范围,并且进一步方便了用户的使用。
【技术实现步骤摘要】
本申请涉及互联网应用
,特别是涉及一种搜索需求识别方法及装置。
技术介绍
搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。传统的搜索引擎,在接收到用户的提交的搜索请求(query)后,首先提取该query所包含的关键词,然后基于文本内容匹配操作,将包含有该关键词的网页或文档返回给用户。随着用户对搜索智能化要求的不断提升,搜索需求识别已经成为搜索领域的一个研究热点。 所谓搜索需求识别,就是根据用户所提交的query,分析和预测用户的需求,确定用户的意图或感兴趣的领域,然后再向其提供相应的信息。例如,用户输入“从北京到上海”这样的query,则可以识别出该用户可能具有较强的地图查询需求或票务查询需求,这样就可以在展示搜索结果时,直接向用户提供地图或票务的相关内容,或者将地图或票务的相关内容排在搜索结果的前面,从而方便用户进一步浏览。搜索需求识别所涉及的关键技术包括语义分析、行为分析、智能人机交互、海量计算处理、信息抽取等等。由于用户query表述方式的多样性,目前一种较为常用的方式是在不同的领域对用户的query进行分析,以实现更有针对性的搜索需求识别。翻译需求是用户在搜索过程中一种较为常见的需求,根据现有技术,当用户输入“XXX翻译”或“XXX是什么意思”这样的query后,搜索引擎可以根据“翻译”或“是什么意思”等明显具有翻译需求的表述,较好地识别出用户具有针对单词“xxx”的翻译需求。但是在实际应用中,用户的query中可能仅包括一个单词或短语,而不包括“翻译”或“是什么意思”等有翻译需求的表述,在这种情况下,现有的搜索引擎还不能够很好地确定用户当前是否具有翻译需求。
技术实现思路
为解决上述技术问题,本申请实施例提供种一种搜索需求识别方法及装置,以实现对用户翻译需求的更有效识别,技术方案如下本申请实施例提供一种搜索需求识别方法,包括预先建立语言模型;接收到搜索请求后,利用所述语言模型得到搜索关键词对应的语言模型概率;根据所述搜索关键词的语言模型概率,判断所述搜索请求是否具有翻译需求;其中,在搜索关键词所包含的单词个数L = I的情况下,所述判断过程包括所述搜索关键词的语言模型概率是否低于预设的概率阈值,如果是,则确定该搜索请求具有翻译需求。根据本申请方案的一种实施方式,在搜索关键词所包含的单词个数L ^ I的情况下,所述判断过程包括计算所述搜索关键词的困惑度;判断所述搜索关键词的困惑度是否高于预设的困惑度阈值,如果是,则确定该搜索请求具有翻译需求,其中,搜索关键词的困惑度= i,P (S)为搜索关键词的语言模型概率。根据本申请方案的一种实施方式,接收到搜索请求后,还包括判断搜索关键词所包含的单词个数是否小于预设的长度阈值,如果是,则进一步利用语言模型得到搜索关键词对应的语言模型概率。根据本申请方案的一种实施方式,所述利用语言模型得到搜索关键词对应的语言 模型概率,包括利用语言模型即时计算得到搜索关键词对应的语言模型概率。根据本申请方案的一种实施方式,所述利用语言模型得到搜索关键词对应的语言模型概率,包括根据预置的语言模型概率表,查询得到搜索关键词对应的语言模型概率。根据本申请方案的一种实施方式,在确定搜索请求具有翻译需求后,还包括对搜索请求对应的翻译结果进行展现,所述翻译结果的展现方法包括在搜索框中,展现搜索请求所对应的翻译结果;或将搜索请求所对应的翻译结果以搜索建议的形式进行展现。根据本申请方案的一种实施方式,在接收到搜索请求并生成搜索建议之后,还包括判断搜索建议的内容是否具有翻译需求。根据本申请方案的一种实施方式,在确定搜索建议的内容具有翻译需求后,还包括将搜索建议对应的翻译内容展现在搜索建议框中。本申请实施例还提供一种搜索需求识别装置,包括建模单元,用于预先建立语言模型;语言模型概率计算单元,用于在接收到搜索请求后,利用所述语言模型得到搜索关键词对应的语言模型概率;翻译需求识别单元,用于根据所述搜索关键词的语言模型概率,判断所述搜索请求是否具有翻译需求;其中,在搜索关键词所包含的单词个数L = I的情况下,所述翻译需求识别单元的判断过程包括所述搜索关键词的语言模型概率是否低于预设的概率阈值,如果是,则确定该搜索请求具有翻译需求。根据本申请方案的一种实施方式,在搜索关键词所包含的单词个数L ^ I的情况下,所述翻译需求识别单元的判断过程包括计算所述搜索关键词的困惑度;判断所述搜索关键词的困惑度是否高于预设的困惑度阈值,如果是,则确定该搜索请求具有翻译需求,其中,搜索关键词的困惑度=—〗,P (S)为搜索关键词的语言模型概率。根据本申请方案的一种实施方式,该装置还包括关键词长度判断单元,用于在接收到搜索请求后,判断搜索关键词所包含的单词个数是否小于预设的长度阈值,如果是,则触发所述语言模型概率计算单元进一步利用语言模型得到搜索关键词对应的语言模型概率。根据本申请方案的一种实施方式,所述语言模型概率计算单元,具体配置为用于利用语言模型即时计算得到搜索关键词对应的语言模型概率。根据本申请方案的一种实施方式,所述语言模型概率计算单元,具体配置为·用于根据预置的语言模型概率表,查询得到搜索关键词对应的语言模型概率。根据本申请方案的一种实施方式,还包括翻译结果展现单元,用于在所述翻译需求识别单元确定搜索请求具有翻译需求后,对搜索请求对应的翻译结果进行展现,所述翻译结果展现单元具体配置为用于在搜索框中,展现搜索请求所对应的翻译结果;或将搜索请求所对应的翻译结果以搜索建议的形式进行展现。根据本申请方案的一种实施方式,所述翻译需求识别单元还用于在接收到搜索请求并生成搜索建议之后,判断搜索建议的内容是否具有翻译需求。根据本申请方案的一种实施方式,所述翻译结果展现单元,还用于在所述翻译需求识别单元确定搜索建议的内容具有翻译需求后,将搜索建议对应的翻译内容展现在搜索建议框中。上述方案利用语言模型概率来判断搜索请求是否具有翻译需求,语言模型概率越低,说明搜索关键词越不常见,相应的翻译需求也就越强。进而,如果用户在搜索过程中,使用的搜索关键词的语言模型概率越低,则可以判断该用户本次的搜索行为具有翻译需求。应用本申请实施例所提供的方案,可以不要求用户在搜索时输入“翻译”或“是什么意思”等明确表示翻译需求的关键词,直接确定用户所输入的内容是否具有翻译需求并给出翻译结果,从而提高了翻译需求识别的应用范围,并且进一步方便了用户的使用。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图I为本申请实施例搜索需求识别方法的流程图;图2为本申请实施例所提供的一种翻译结果展现方式示意图;图3为本申请实施例所提供的第二种翻译结果展现方式示意图;图4为本申请实施例所提供的第三种翻译结果展现方式示意图;图5为本申请实施例搜索需求识别装置的第一种结构示意图;图6为本申请实施例搜索需求识别装置的第二种结构示意本文档来自技高网...
【技术保护点】
一种搜索需求识别方法,其特征在于,包括:预先建立语言模型;接收到搜索请求后,利用所述语言模型得到搜索关键词对应的语言模型概率;根据所述搜索关键词的语言模型概率,判断所述搜索请求是否具有翻译需求;其中,在搜索关键词所包含的单词个数L=1的情况下,所述判断过程包括:所述搜索关键词的语言模型概率是否低于预设的概率阈值,如果是,则确定该搜索请求具有翻译需求。
【技术特征摘要】
【专利技术属性】
技术研发人员:蓝翔,柴春光,吴华,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。