一种基于智能坐席知识库的搜索方法及系统技术方案

技术编号:24517760 阅读:12 留言:0更新日期:2020-06-17 06:51
本发明专利技术公开了一种基于智能坐席知识库的搜索引擎,包括:输入搜索内容,对搜索内容进行分词;对所述分词先进行过滤纠错再进行语义解析,得到分词的语义信息;将所述语义信息与知识库的多组问题进行匹配查询,若匹配上,则输出将匹配上的一组问题所对应的答案;若未匹配,将所述语义信息在所述知识库中通过全文检索进行匹配查询,输出将匹配上的一组问题所对应的答案。本发明专利技术提出的基于智能坐席知识库的搜索引擎及系统,通过自然语义检索结合全文检索的方式,能够提高搜索的效率以及准确率。

A search method and system based on intelligent seat knowledge base

【技术实现步骤摘要】
一种基于智能坐席知识库的搜索方法及系统
本专利技术涉及搜索引擎
,特别是指一种基于智能坐席知识库的搜索引擎及系统。
技术介绍
随着互联网在近几年来的高速发展,上网的人数呈现高速增长的趋势。互联网作为最大最便利的信息载体,已成为许多人获取知识的重要途径。但是,互联网的信息量呈爆炸趋势增长,几年前全球式搜索引擎收录的网页量只有几千万页,而现在已经达到几十亿页。数量增加带来的是搜索服务的火热,同时也使传统的综合性搜索,如百度和谷歌的品质下降,搜索引擎在搜集网络信息上远赶不上网络信息的增长速度,同时查询的结果集是海量的,经常是几十万笔的资料,看上去很好,想找到合适的结果,却比较难,搜索结果里存在大量的重复信息和垃圾信息,用户很难在短时间内准确地筛选出需要的内容。目前,大部分公司的呼叫中心运营过程中,坐席使用的知识库存在以下问题:知识结构单一,以非结构化知识为主,知识搜索不准确,响应慢,需要使用者对于搜索的知识有一定了解,搜索缺乏知识相关性关联,知识展现形式单一等特点,客服无法在知识库中快速找到知识,以及通过知识库快速学习掌握知识。因此,现有搜索技术无法准确定位知识,并且需要使用者对于搜索的知识有一定了解,具有知识搜索效率低、知识积累无体系、知识关联少等弊端。
技术实现思路
有鉴于此,本专利技术的目的在于提出一种基于智能坐席知识库的搜索引擎及系统,能够提高搜索的准确率。基于上述目的本专利技术提供的一种基于智能坐席知识库的搜索引擎,包括:输入搜索内容,对搜索内容进行分词;对所述分词先进行过滤纠错再进行语义解析,得到分词的语义信息;将所述语义信息与知识库的多组问题进行匹配查询,若匹配上,则输出将匹配上的一组问题所对应的答案;若未匹配,将所述语义信息在所述知识库中通过全文检索进行匹配查询,输出将匹配上的一组问题所对应的答案。可选的,所述将所述语义信息在所述知识库中通过全文检索进行匹配查询包括:将所述语义信息在所述知识库的文档数据、标准问以及答案信息中进行全文检索,逐条显示出所述语义信息对应的搜索结果。可选的,所述全文检索是以结构化中的问题为最小单位,将所述文档数据的目录内容、存储的问题、存储的答案以及相关素材文件在全文检索中一次性搜索完成,得到搜索结果。可选的,所述搜索结果包括:与所述语义信息相关的文档数据目录的汇总、语义精准定位的答案、语义推荐的相关问题以及底层算法推荐的协同数据。可选的,所述搜索结果是按照所述语义信息与所述搜索内容的语义相似度从高到低依次显示出所述语义信息对应的检索结果。可选的,所述语义相似度包括:按照文档数据的创建时间、修改时间从晚到早的顺序依次显示出所述语义信息对应的检索结果,以及按照文档数据的点击量从多到少的顺序依次显示出所述语义信息对应的检索结果。可选的,所述语义信息包括至少以下一项:分词的同义词和同义词组合;分词的同义词或同义词组合;分词的同类词和同类词组合;分词的同类词或同类词组合;与分词具有相同或相似结构的实体。可选的,所述知识库至少包括多组问题以及与每组问题对应的答案信息,所述每组问题包括至少一个语义匹配结构。本专利技术还提供了一种采用上述任意一项方法的基于智能坐席知识库的搜索引擎系统,包括:搜索引擎用户端,用于将输入的搜索内容送入自然语言处理模块;自然语言处理模块,对搜索内容进行分词,对所述分词先进行过滤纠错再语义解析,得到分词的语义信息;知识库模块,将所述语义信息与知识库的多组问题进行匹配查询,若匹配上,则输出将匹配上的一组问题所对应的答案;若未匹配,将所述语义信息送入全文检索模块;全文检索模块,将所述语义信息在所述知识库中通过全文检索进行匹配查询,输出将匹配上的一组问题所对应的答案。可选的,所述全文检索模块包括智能语义搜索和全文搜索;所述智能语义搜索基于对输入的自然语言的理解,将所述知识库的对应答案以FAQ(检索系统)的形式进行搜索结果展现。从上面所述可以看出,本专利技术提供的基于智能坐席知识库的搜索引擎及系统,通过对搜索内容进行分词、过滤纠错以及语义解析得到语义信息,将语义信息与知识库的多组问题进行匹配查询,不仅对待搜索内容进行检索,而且对待搜索内容的语义信息进行检索,通过全文检索的方式保证了搜索结果,避免了仅与知识库中的问题进行匹配查询时会没有搜索结果的情况,同时也进一步提高了搜索的准确性。本专利技术提供的知识库是基于全球最大的中文语义库,对接公司业务知识库,相比于现有技术中仅包含文档数据的数据库来说较为全面,通过自然语义检索结合全文检索的方式,一方面提高了搜索效率以及准确率,另一方面也最大限度降低搜索结果对于业务知识熟悉程度的依赖。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的基于智能坐席知识库的搜索引擎的实施例流程示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术进一步详细说明。基于上述目的,本专利技术的实施例提出了一种基于智能坐席知识库的搜索引擎及系统,主要应用于面向企业的客服中心的人工座席知识和面向企业的客服中心知识培训。如图1所示,为本专利技术提供的基于智能坐席知识库的搜索引擎的实施例流程示意图;本专利技术提供的一种基于智能坐席知识库的搜索引擎,包括:步骤1:输入搜索内容,步骤2:对搜索内容进行分词;步骤3:对所述分词先进行过滤纠错,步骤4:再进行语义解析,步骤5:得到分词的语义信息;步骤6:将所述语义信息与知识库的多组问题进行匹配查询,步骤7:若匹配上,则输出将匹配上的一组问题所对应的答案;步骤8:若未匹配,将所述语义信息在所述知识库中通过全文检索进行匹配查询,步骤9:输出将匹配上的一组问题所对应的答案。作为一个较佳的实施例,步骤3:对所述分词先进行过滤纠错中,以过滤掉在以下方面有错误的分词:不全、拼写,和/或,语法。先对分词的结果进行过滤纠错再进行语义解析,可以使语义解析的结果更加准确,从而提升搜索结果的准确性。在步骤5中得到分词的语义信息,所述语义信息包括至少以下一项:分词的同义词和同义词组合;分词的同义词或同义词组合;例如,分词“天气”的语义信息包括其同义词“气候”等。分词的同类词和同类词组合,分词的同类词或同类词组合;其中,分词的同类词表示与该分词属于同一类别的词汇。如若分词属于地名,则该分词的同类词可包括其他地名。例如,分词“上海”的语义信息可包括“北京”、“天津”等。与分词具有相同或相似结构的实体,其中,与分词具有相同或相似结构的实体表示该实体的信息结构与分词相同或相似。该实体可为特殊语义表达式。例如,分词为一个本文档来自技高网...

【技术保护点】
1.一种基于智能坐席知识库的搜索方法,其特征在于,包括:/n输入搜索内容,对搜索内容进行分词;/n对所述分词先进行过滤纠错再进行语义解析,得到分词的语义信息;/n将所述语义信息与知识库的多组问题进行匹配查询,若匹配上,则输出将匹配上的一组问题所对应的答案;若未匹配,将所述语义信息在所述知识库中通过全文检索进行匹配查询,输出将匹配上的一组问题所对应的答案。/n

【技术特征摘要】
1.一种基于智能坐席知识库的搜索方法,其特征在于,包括:
输入搜索内容,对搜索内容进行分词;
对所述分词先进行过滤纠错再进行语义解析,得到分词的语义信息;
将所述语义信息与知识库的多组问题进行匹配查询,若匹配上,则输出将匹配上的一组问题所对应的答案;若未匹配,将所述语义信息在所述知识库中通过全文检索进行匹配查询,输出将匹配上的一组问题所对应的答案。


2.根据权利要求1所述的基于智能坐席知识库的搜索引擎,其特征在于,所述将所述语义信息在所述知识库中通过全文检索进行匹配查询包括:将所述语义信息在所述知识库的文档数据、标准问以及答案信息中进行全文检索,逐条显示出所述语义信息对应的搜索结果。


3.根据权利要求2所述的基于智能坐席知识库的搜索引擎,其特征在于,所述全文检索是以结构化中的问题为最小单位,将所述文档数据的目录内容、存储的问题、存储的答案以及相关素材文件在全文检索中一次性搜索完成,得到搜索结果。


4.根据权利要求2所述的基于智能坐席知识库的搜索引擎,其特征在于,所述搜索结果包括:与所述语义信息相关的文档数据目录的汇总、语义精准定位的答案、语义推荐的相关问题以及底层算法推荐的协同数据。


5.根据权利要求2所述的基于智能坐席知识库的搜索引擎,其特征在于,所述搜索结果是按照所述语义信息与所述搜索内容的语义相似度从高到低依次显示出所述语义信息对应的检索结果。


6.根据权利要求5所述的基于智能坐席知识库的搜索引擎,其特征在于,所述语义相似度包括:按照文档数...

【专利技术属性】
技术研发人员:佘家驹黄芙蓉
申请(专利权)人:北京国电通网络技术有限公司国网信息通信产业集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1