信息搜索的方法及装置、人工座席服务方法及系统制造方法及图纸

技术编号:14965777 阅读:170 留言:0更新日期:2017-04-02 20:24
本发明专利技术提出了一种信息搜索的方法及装置、人工座席服务方法及系统,该信息搜索的方法包括:对输入的待搜索内容的文本进行分词;对分词的结果进行语义解析得到各分词的语义信息;将所述语义信息与所述知识库的多组问题进行匹配查询,若匹配上,则将匹配上的一组问题所对应的答案信息作为搜索结果;否则,则通过全文检索的方式在所述知识库中进行查询以得到与所述语义信息对应的搜索结果。通过对输入的待搜索文本进行更好的语义理解,能够提供更准确的答案信息。即使基于语义信息没能在知识库中匹配查询到相应问题时,也可以转而采用全文检索的方式在知识库中的文档数据中进行检索以给出对应的检索结果,故能够更加准确高效的提供知识库的搜索结果。

【技术实现步骤摘要】

本专利技术涉及计算机
,尤其涉及信息搜索的方法及装置、人工座席服务方法及系统
技术介绍
现有的在海量信息的知识库中搜索有效信息的方式通常包括以下两种:一、通过全文检索的方式进行搜索;二、通过关键词查询的方式进行搜索。上述搜索方式无法准确定位出有效信息,而是需要使用者对于知识有一定了解之后或者具备一定的搜索技巧后才能得到较为准确的结果。
技术实现思路
本专利技术要解决的技术问题是,提供信息搜索的方法及装置、人工座席服务方法及系统,更加准确高效的提供知识库的搜索结果。本专利技术采用的技术方案是,所述信息搜索的方法,包括:对输入的待搜索内容的文本进行分词;对分词的结果进行语义解析得到各分词的语义信息;提供知识库,所述知识库至少包括多组问题和与每组问题对应的答案信息;将所述语义信息与所述知识库的多组问题进行匹配查询,若匹配上,则将匹配上的一组问题所对应的答案信息作为搜索结果;否则,则通过全文检索的方式在所述知识库中进行查询以得到与所述语义信息对应的搜索结果。进一步的,所述方法,还包括:在对分词的结果进行语义解析之前,对所述分词的结果进行过滤纠错,以过滤掉在以下方面有错误的分词:拼写,和/或,语法。进一步的,每组问题包括一个或多个语义匹配结构;所述语义匹配结构包括以下至少一项:1)多个词汇以及该多个词汇中至少一个词汇的语义信息;2)所述多个词汇之间的逻辑关系。进一步的,所述知识库还包括:文档数据;所述问题包括:标准问;所述通过全文检索的方式在所述知识库中进行查询以得到所述语义信息对应的检索结果,包括:基于所述语义信息在所述知识库的文档数据、标准问和答案信息中进行全文检索,逐条显示出所述语义信息对应的检索结果。进一步的,逐条显示出所述语义信息对应的检索结果,包括:按照所述语义信息与所述待搜索内容的语义相似度从高到底依次显示出所述语义信息对应的检索结果;对于语义相似度相同的情况,则:按照文档数据的创建时间从晚到早的顺序依次显示出所述语义信息对应的检索结果,或者,按照文档数据的修改时间从晚到早的顺序依次显示出所述语义信息对应的检索结果,或者,按照文档数据的点击量从多到少的顺序依次显示出所述语义信息对应的检索结果。进一步的,所述语义信息包括以下至少一项:1)分词的同义词和/或同义词组合;2)分词的同类词和/或同类词组合;3)与分词具有相同或相似结构的实体。本专利技术提供一种人工座席服务方法,包括上述的信息搜索的方法。本专利技术还提供一种信息搜索的装置,包括:分词模块,用于对输入的待搜索内容的文本进行分词;语义解析模块,用于对分词的结果进行语义解析得到各分词的语义信息;匹配查询模块,用于将所述语义信息与所述知识库的多组问题进行匹配查询,若匹配上,则将匹配上的一组问题所对应的答案信息作为搜索结果;否则,则通过全文检索的方式在所述知识库中进行查询以得到与所述语义信息对应的搜索结果;所述知识库至少包括多组问题和与每组问题对应的答案信息。进一步的,所述装置,还包括:过滤纠错模块,用于在对分词的结果进行语义解析之前,对所述分词的结果进行过滤纠错,以过滤掉在以下方面有错误的分词:拼写,和/或,语法。进一步的,每组问题包括一个或多个语义匹配结构;所述语义匹配结构包括以下至少一项:1)多个词汇以及该多个词汇中至少一个词汇的语义信息;2)所述多个词汇之间的逻辑关系。进一步的,所述知识库还包括:文档数据;所述问题包括:标准问;所述匹配查询模块,用于:基于所述语义信息在所述知识库的文档数据、标准问和答案信息中进行全文检索,逐条显示出所述语义信息对应的检索结果。进一步的,所述匹配查询模块,用于:按照所述语义信息与所述待搜索内容的语义相似度从高到底依次显示出所述语义信息对应的检索结果;对于语义相似度相同的情况,则:按照文档数据的创建时间从晚到早的顺序依次显示出所述语义信息对应的检索结果,或者,按照文档数据的修改时间从晚到早的顺序依次显示出所述语义信息对应的检索结果,或者,按照文档数据的点击量从多到少的顺序依次显示出所述语义信息对应的检索结果。进一步的,所述语义信息包括以下至少一项:1)分词的同义词和/或同义词组合;2)分词的同类词和/或同类词组合;3)与分词具有相同或相似结构的实体。本专利技术提供一种人工座席服务系统,包括上述的信息搜索的装置。采用上述技术方案,本专利技术所述信息搜索的方法及装置、人工座席服务方法及系统至少具有下列优点:1、本专利技术将待搜索的文本先与知识库中的问题进行匹配查询,从而优先提供更准确更快速的搜索结果,体现出较高的检索效率;2、本专利技术通过全文检索的方式可以保证必然会提供搜索结果,避免了仅与知识库中的问题进行匹配查询时可以能会没有搜索结果的情况;3、本专利技术进行全文检索时,不仅对待搜索内容进行检索,而且对待搜索内容的语义信息进行检索,从而进一步提高了搜索的准确性;4、最大限度降低搜索结果对于业务知识熟悉程度的依赖;5、本专利技术通过对输入的待搜索文本进行更好的语义理解,能够提供更准确的答案信息。附图说明图1为本专利技术第一实施例的信息搜索的方法流程图;图2为本专利技术第二实施例的信息搜索的装置组成结构示意图。具体实施方式为更进一步阐述本专利技术为达成预定目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本专利技术进行详细说明如后。本专利技术第一实施例,一种信息搜索的方法,如图1所示,包括以下具体步骤:步骤S101,对输入的待搜索内容的文本进行分词;步骤S102,对分词的结果进行语义解析得到各分词的语义信息。具体的,所述语义信息包括以下至少一项:1)分词的同义词和/或同义词组合;例如,分词“天气”的语义信息包括其同义词“气候”等。2)分词的同类词和/或同类词组合;其中,分词的同类词表示与该分词属于同一类别的词汇。如若分词属于地名,则该分词的同类词可包括其他地名。例如,分词“上海”的语义信息可包括“北京”、“天津”等。3)与分词具有相同或相似结构的实体。其中,与分词具有相同或相似结构的实体表示该实体的信息结构与分词相同或相似。优选地,该实体可为特殊语义表达式。例如,分词为一个特定时间结构“2013年1月1日10点45分”,则与分词具有相同或相似结构的实体可为一个日期语义表达式“XXXX年XX月XX日XX点XX分”等。本文档来自技高网...

【技术保护点】
一种信息搜索的方法,其特征在于,包括:对输入的待搜索内容的文本进行分词;对分词的结果进行语义解析得到各分词的语义信息;提供知识库,所述知识库至少包括多组问题和与每组问题对应的答案信息;将所述语义信息与所述知识库的多组问题进行匹配查询,若匹配上,则将匹配上的一组问题所对应的答案信息作为搜索结果;否则,则通过全文检索的方式在所述知识库中进行查询以得到与所述语义信息对应的搜索结果。

【技术特征摘要】
1.一种信息搜索的方法,其特征在于,包括:
对输入的待搜索内容的文本进行分词;
对分词的结果进行语义解析得到各分词的语义信息;
提供知识库,所述知识库至少包括多组问题和与每组问题对应的答案信息;
将所述语义信息与所述知识库的多组问题进行匹配查询,若匹配上,则将
匹配上的一组问题所对应的答案信息作为搜索结果;否则,则通过全文检索的
方式在所述知识库中进行查询以得到与所述语义信息对应的搜索结果。
2.根据权利要求1所述的信息搜索的方法,其特征在于,所述方法,还包
括:
在对分词的结果进行语义解析之前,对所述分词的结果进行过滤纠错,以
过滤掉在以下方面有错误的分词:拼写,和/或,语法。
3.根据权利要求1所述的信息搜索的方法,其特征在于,每组问题包括一
个或多个语义匹配结构;
所述语义匹配结构包括以下至少一项:
1)多个词汇以及该多个词汇中至少一个词汇的语义信息;
2)所述多个词汇之间的逻辑关系。
4.根据权利要求1所述的信息搜索的方法,其特征在于,所述知识库还包
括:文档数据;所述问题包括:标准问;
所述通过全文检索的方式在所述知识库中进行查询以得到所述语义信息对
应的检索结果,包括:
基于所述语义信息在所述知识库的文档数据、标准问和答案信息中进行全
文检索,逐条显示出所述语义信息对应的检索结果。
5.根据权利要求4所述的信息搜索的方法,其特征在于,逐条显示出所述
语义信息对应的检索结果,包括:
按照所述语义信息与所述待搜索内容的语义相似度从高到底依次显示出所
述语义信息对应的检索结果;
对于语义相似度相同的情况,则:按照文档数据的创建时间从晚到早的顺
序依次显示出所述语义信息对应的检索结果,或者,按照文档数据的修改时间
从晚到早的顺序依次显示出所述语义信息对应的检索结果,或者,按照文档数
据的点击量从多到少的顺序依次显示出所述语义信息对应的检索结果。
6.根据权利要求1~5中任一项所述的信息搜索的方法,其特征在于,所述
语义信息包括以下至少一项:
1)分词的同义词和/或同义词组合;
2)分词的同类词和/或同类词组合;
3)与分词具有相同或相似结构的实体。
7.一种人工座席服务方法,其特征在于,包括如权利要求1-6中任一项所
述的信息搜索的方法。...

【专利技术属性】
技术研发人员:刘欣钱凌朱频频
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1