基于上下文理解的信息搜索方法和系统技术方案

技术编号:11604506 阅读:189 留言:0更新日期:2015-06-17 01:56
本发明专利技术公开一种基于上下文理解的信息搜索方法和系统。其中在信息搜索方法中,在与用户的会话过程中,当接收到用户提供的会话信息时,利用会话信息生成当前搜索表达式,利用当前搜索表达式在网络中进行搜索,判断当前搜索结果是否达到相应的置信度,若当前搜索结果达到相应的置信度,则将当前搜索结果提供给用户,若当前搜索结果没有达到相应的置信度,则利用用户的历史会话记录,对当前搜索表达式进行扩展,将扩展后的搜索表达式作为当前搜索表达式,然后重复执行利用当前搜索表达式在网络中进行搜索。通过针对对话语境,基于会话的上下文理解进行信息搜索,解决用户搜索表达不准、节约用户重复输入类似问题的问题,提高了用户体验。

【技术实现步骤摘要】

本专利技术涉及通信领域,特别涉及一种基于上下文理解的信息搜索方法和系统
技术介绍
搜索是指根据一定的策略、运用特定的计算机程序从互联网上搜集与用户检索信息相关的信息。由于互联网上具有海量信息,因此若搜索表达式不完整,则往往会得到大量的无关结果。因此需要用户输入完整的搜索表达式,才有可能得到所期望的结果。例如,在诸如呼叫中心的服务环境下,当用户向服务平台提供搜索信息,服务平台根据用户提供的搜索信息进行搜索,并将搜索结果发送给用户。若用户询问北京明天的天气如何,服务平台会搜索北京明天的天气状况,并将搜索结果发送给用户。若用户接着询问上海明天的天气如何,服务平台会搜索上海明天的天气状况,并将搜索结果发送给用户。但用户往往不会这样表达,在询问北京明天的天气后而仅简单地询问:上海呢?此时服务平台若仅针对用户该询问信息进行搜索,无法搜索到用户所希望的信息。
技术实现思路
本专利技术实施例提供一种基于上下文理解的信息搜索方法和系统。通过基于会话的上下文理解进行信息搜索,从而可实现智能搜索,解决了用户搜索表达不准、节约用户重复输入类似问题的问题,提高了用户体验。根据本专利技术的一个方面,提供一种基于上下文理解的信息搜索方法,包括:在与用户的会话过程中,当接收到用户提供的会话信息时,利用会话信息生成当前搜索表达式;利用当前搜索表达式在网络中进行搜索;判断当前搜索结果是否达到相应的置信度;若当前搜索结果达到相应的置信度,则将当前搜索结果提供给用户;若当前搜索结果没有达到相应的置信度,则提取用户的历史会话记录;利用用户的历史会话记录,对当前搜索表达式进行扩展,将扩展后的搜索表达式作为当前搜索表达式;然后执行利用当前搜索表达式在网络中进行搜索的步骤。优选的,利用用户的历史会话记录,对当前搜索表达式进行扩展,将扩展后的搜索表达式作为当前搜索表达式的步骤包括:利用用户的历史会话记录,重新确定搜索表达概念;根据重新确定的搜索表达概念,对当前搜索表达式进行扩展;将扩展后的搜索表达式作为当前搜索表达式。优选的,若当前搜索结果没有达到相应的置信度,还包括:判断搜索次数是否小于预定的搜索次数阈值;若搜索次数小于预定的搜索次数阈值,则执行提取用户的历史会话记录的步骤;若搜索次数不小于预定的搜索次数阈值,则将当前搜索结果中置信度最高的m个结果提供给用户,m为大于0的正整数。优选的,利用用户的历史会话记录,对当前搜索表达式进行扩展,将扩展后的搜索表达式作为当前搜索表达式的步骤后,还包括:判断当前搜索表达式的扩展度是否大于预定的扩展阈值;若当前搜索表达式的扩展度不大于预定的扩展阈值,则执行利用当前搜索表达式在网络中进行搜索的步骤;若当前搜索表达式的扩展度大于预定的扩展阈值,则将当前搜索结果中置信度最高的m个结果提供给用户,m为大于0的正整数。优选的,用户提供的会话信息为文本信息或语音信息;当接收到用户提供的会话信息为语音信息时,利用会话信息生成当前搜索表达式的步骤包括:对语音信息进行识别,以得到语音识别信息;利用用户会话的上下文确定搜索表达概念;利用搜索表达概念和语音识别信息生成当前搜索表达式。根据本专利技术的另一方面,提供一种基于上下文理解的信息搜索系统,包括接收单元、搜索表达式生成单元、搜索单元、第一识别单元、发送单元、提取单元和表达式扩展单元,其中:接收单元,用于在与用户的会话过程中接收用户提供的会话信息;搜索表达式生成单元,用于当接收单元接收到用户提供的会话信息时,利用会话信息生成当前搜索表达式;搜索单元,用于利用当前搜索表达式在网络中进行搜索;第一识别单元,用于判断当前搜索结果是否达到相应的置信度;发送单元,用于根据第一识别单元的判断结果,若当前搜索结果达到相应的置信度,则将当前搜索结果提供给用户;提取单元,用于根据第一识别单元的判断结果,若当前搜索结果没有达到相应的置信度,则提取用户的历史会话记录;表达式扩展单元,用于利用用户的历史会话记录,对当前搜索表达式进行扩展,将扩展后的搜索表达式作为当前搜索表达式;然后指示搜索单元执行利用当前搜索表达式在网络中进行搜索的操作。优选的,表达式扩展单元具体包括概念确定模块、扩展模块和更新模块,其中:概念确定模块,用于利用用户的历史会话记录,重新确定搜索表达概念;扩展模块,用于根据重新确定的搜索表达概念,对当前搜索表达式进行扩展;更新模块,用于将扩展后的搜索表达式作为当前搜索表达式。优选的,上述系统还包括第二识别单元,其中:第二识别单元,用于根据第一识别单元的判断结果,若当前搜索结果没有达到相应的置信度,判断搜索次数是否小于预定的搜索次数阈值;若搜索次数小于预定的搜索次数阈值,则指示提取单元执行提取用户的历史会话记录的操作;若搜索次数不小于预定的搜索次数阈值,则指示发送单元将当前搜索结果中置信度最高的m个结果提供给用户,m为大于0的正整数。优选的,上述系统还包括第三识别单元,其中:第三识别单元,用于表达式扩展单元在利用用户的历史会话记录,对当前搜索表达式进行扩展,将扩展后的搜索表达式作为当前搜索表达式的操作后,判断当前搜索表达式的扩展度是否大于预定的扩展阈值;若当前搜索表达式的扩展度不大于预定的扩展阈值,则指示搜索单元执行利用当前搜索表达式在网络中进行搜索的操作;若当前搜索表达式的扩展度大于预定的扩展阈值,则指示发送单元将当前搜索结果中置信度最高的m个结果提供给用户,m为大于0的正整数。优选的,用户提供的会话信息为文本信息或语音信息;搜索表达式生成单元还用于当接收到用户提供的会话信息为语音信息时,对语音信息进行识别,以得到语音识别信息,利用用户会话的上下文确定搜索表达概念,利用搜索表达概念和语音识别信息生成当前搜索表达式。本专利技术通过针对对话语境,基于会话的上下文理解进行信息搜索,从而可实现智能搜索,解决了用户搜索表达不准、节约用户重复输入类似问题的问题,提高了用户体验。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术信息本文档来自技高网...

【技术保护点】
一种基于上下文理解的信息搜索方法,其特征在于,包括:在与用户的会话过程中,当接收到用户提供的会话信息时,利用会话信息生成当前搜索表达式;利用当前搜索表达式在网络中进行搜索;判断当前搜索结果是否达到相应的置信度;若当前搜索结果达到相应的置信度,则将当前搜索结果提供给用户;若当前搜索结果没有达到相应的置信度,则提取用户的历史会话记录;利用用户的历史会话记录,对当前搜索表达式进行扩展,将扩展后的搜索表达式作为当前搜索表达式;然后执行利用当前搜索表达式在网络中进行搜索的步骤。

【技术特征摘要】
1.一种基于上下文理解的信息搜索方法,其特征在于,包括:
在与用户的会话过程中,当接收到用户提供的会话信息时,利用会
话信息生成当前搜索表达式;
利用当前搜索表达式在网络中进行搜索;
判断当前搜索结果是否达到相应的置信度;
若当前搜索结果达到相应的置信度,则将当前搜索结果提供给用
户;
若当前搜索结果没有达到相应的置信度,则提取用户的历史会话记
录;
利用用户的历史会话记录,对当前搜索表达式进行扩展,将扩展后
的搜索表达式作为当前搜索表达式;
然后执行利用当前搜索表达式在网络中进行搜索的步骤。
2.根据权利要求1所述的方法,其特征在于,
利用用户的历史会话记录,对当前搜索表达式进行扩展,将扩展后
的搜索表达式作为当前搜索表达式的步骤包括:
利用用户的历史会话记录,重新确定搜索表达概念;
根据重新确定的搜索表达概念,对当前搜索表达式进行扩展;
将扩展后的搜索表达式作为当前搜索表达式。
3.根据权利要求1或2所述的方法,其特征在于,
若当前搜索结果没有达到相应的置信度,还包括:
判断搜索次数是否小于预定的搜索次数阈值;
若搜索次数小于预定的搜索次数阈值,则执行提取用户的历史会话
记录的步骤;
若搜索次数不小于预定的搜索次数阈值,则将当前搜索结果中置信
度最高的m个结果提供给用户,m为大于0的正整数。
4.根据权利要求1或2所述的方法,其特征在于,
利用用户的历史会话记录,对当前搜索表达式进行扩展,将扩展后
的搜索表达式作为当前搜索表达式的步骤后,还包括:
判断当前搜索表达式的扩展度是否大于预定的扩展阈值;
若当前搜索表达式的扩展度不大于预定的扩展阈值,则执行利用当
前搜索表达式在网络中进行搜索的步骤;
若当前搜索表达式的扩展度大于预定的扩展阈值,则将当前搜索结
果中置信度最高的m个结果提供给用户,m为大于0的正整数。
5.根据权利要求1或2所述的方法,其特征在于,
用户提供的会话信息为文本信息或语音信息;
当接收到用户提供的会话信息为语音信息时,利用会话信息生成当
前搜索表达式的步骤包括:
对语音信息进行识别,以得到语音识别信息;
利用用户会话的上下文确定搜索表达概念;
利用搜索表达概念和语音识别信息生成当前搜索表达式。
6.一种基于上下文理解的信息搜索系统,其特征在于,包括接收
单元、搜索表达式生成单元、搜索单元、第一识别单元、发送单元、提
取单元和表达式扩展单元,其中:
接收单元,用于在与用户的会话过程中接收用户提供的会话信息;
搜索表达式生成单元...

【专利技术属性】
技术研发人员:杨震柯卫夏艳王建青罗晓东熊静王桢俞惠华
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1