【技术实现步骤摘要】
本专利技术涉及通信领域,特别涉及一种基于上下文理解的信息搜索方法和系统。
技术介绍
搜索是指根据一定的策略、运用特定的计算机程序从互联网上搜集与用户检索信息相关的信息。由于互联网上具有海量信息,因此若搜索表达式不完整,则往往会得到大量的无关结果。因此需要用户输入完整的搜索表达式,才有可能得到所期望的结果。例如,在诸如呼叫中心的服务环境下,当用户向服务平台提供搜索信息,服务平台根据用户提供的搜索信息进行搜索,并将搜索结果发送给用户。若用户询问北京明天的天气如何,服务平台会搜索北京明天的天气状况,并将搜索结果发送给用户。若用户接着询问上海明天的天气如何,服务平台会搜索上海明天的天气状况,并将搜索结果发送给用户。但用户往往不会这样表达,在询问北京明天的天气后而仅简单地询问:上海呢?此时服务平台若仅针对用户该询问信息进行搜索,无法搜索到用户所希望的信息。
技术实现思路
本专利技术实施例提供一种基于上下文理解的信息搜索方法和系统。通过基于会话的上下文理解进行信息搜索,从而可实现智能搜索,解决了用户搜索表达不准、节约用户重复输入类似问题的问题,提高了用户体验。根据本专利技术的一个方面,提供一种基于上下文理解的信息搜索方法,包括:在与用户的会话过程中,当接收到用户提供的会话信息时,利用会话信息生成当前搜索表达式;利用当前搜索表达式在网络中进行搜索;判断当前搜索结果是否 ...
【技术保护点】
一种基于上下文理解的信息搜索方法,其特征在于,包括:在与用户的会话过程中,当接收到用户提供的会话信息时,利用会话信息生成当前搜索表达式;利用当前搜索表达式在网络中进行搜索;判断当前搜索结果是否达到相应的置信度;若当前搜索结果达到相应的置信度,则将当前搜索结果提供给用户;若当前搜索结果没有达到相应的置信度,则提取用户的历史会话记录;利用用户的历史会话记录,对当前搜索表达式进行扩展,将扩展后的搜索表达式作为当前搜索表达式;然后执行利用当前搜索表达式在网络中进行搜索的步骤。
【技术特征摘要】
1.一种基于上下文理解的信息搜索方法,其特征在于,包括:
在与用户的会话过程中,当接收到用户提供的会话信息时,利用会
话信息生成当前搜索表达式;
利用当前搜索表达式在网络中进行搜索;
判断当前搜索结果是否达到相应的置信度;
若当前搜索结果达到相应的置信度,则将当前搜索结果提供给用
户;
若当前搜索结果没有达到相应的置信度,则提取用户的历史会话记
录;
利用用户的历史会话记录,对当前搜索表达式进行扩展,将扩展后
的搜索表达式作为当前搜索表达式;
然后执行利用当前搜索表达式在网络中进行搜索的步骤。
2.根据权利要求1所述的方法,其特征在于,
利用用户的历史会话记录,对当前搜索表达式进行扩展,将扩展后
的搜索表达式作为当前搜索表达式的步骤包括:
利用用户的历史会话记录,重新确定搜索表达概念;
根据重新确定的搜索表达概念,对当前搜索表达式进行扩展;
将扩展后的搜索表达式作为当前搜索表达式。
3.根据权利要求1或2所述的方法,其特征在于,
若当前搜索结果没有达到相应的置信度,还包括:
判断搜索次数是否小于预定的搜索次数阈值;
若搜索次数小于预定的搜索次数阈值,则执行提取用户的历史会话
记录的步骤;
若搜索次数不小于预定的搜索次数阈值,则将当前搜索结果中置信
度最高的m个结果提供给用户,m为大于0的正整数。
4.根据权利要求1或2所述的方法,其特征在于,
利用用户的历史会话记录,对当前搜索表达式进行扩展,将扩展后
的搜索表达式作为当前搜索表达式的步骤后,还包括:
判断当前搜索表达式的扩展度是否大于预定的扩展阈值;
若当前搜索表达式的扩展度不大于预定的扩展阈值,则执行利用当
前搜索表达式在网络中进行搜索的步骤;
若当前搜索表达式的扩展度大于预定的扩展阈值,则将当前搜索结
果中置信度最高的m个结果提供给用户,m为大于0的正整数。
5.根据权利要求1或2所述的方法,其特征在于,
用户提供的会话信息为文本信息或语音信息;
当接收到用户提供的会话信息为语音信息时,利用会话信息生成当
前搜索表达式的步骤包括:
对语音信息进行识别,以得到语音识别信息;
利用用户会话的上下文确定搜索表达概念;
利用搜索表达概念和语音识别信息生成当前搜索表达式。
6.一种基于上下文理解的信息搜索系统,其特征在于,包括接收
单元、搜索表达式生成单元、搜索单元、第一识别单元、发送单元、提
取单元和表达式扩展单元,其中:
接收单元,用于在与用户的会话过程中接收用户提供的会话信息;
搜索表达式生成单元...
【专利技术属性】
技术研发人员:杨震,柯卫,夏艳,王建青,罗晓东,熊静,王桢,俞惠华,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。