智能问答系统的信息处理方法及信息处理装置制造方法及图纸

技术编号:14844241 阅读:111 留言:0更新日期:2017-03-17 11:21
本发明专利技术提供了一种智能问答系统的信息处理方法,该智能问答系统包括标准问数据库,该信息处理方法包括:执行用户问题与该标准问数据库的语义相似度计算以确定该用户问题是否被定位至该标准问数据库中的标准问;响应于该用户问题未被定位至该标准问数据库中的标准问判断该用户问题是否包括口语化表述;响应于该用户问题包括口语化表述对该用户问题进行语句调整;以及用经语句调整后的用户问题执行与该标准问数据库的相似度计算来定位标准问。

【技术实现步骤摘要】

本专利技术涉及人机交互
,尤其涉及智能问答系统的信息处理方法及信息处理装置
技术介绍
人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现各种人工智能系统,例如,智能客服系统、语音控制系统等等。人工智能语义识别是人机交互的基础,其能够对人类语言进行识别,以转换成机器能够理解的语言。智能问答系统是人机交互的一种典型应用,其中当用户提出问题后,智能问答系统给出该问题的答案。为此,智能问答系统中有一套知识库,里面有大量的问题和与每个问题相对应的答案。智能问答系统首先需要识别用户所提出的问题,即从知识库中找到与该用户问题所对应的问题,然后找出与该问题相匹配的答案。如何提高智能问答系统的答复正确率是一项重要挑战。
技术实现思路
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。根据本专利技术的一方面,提供了一种智能问答系统的信息处理方法,该智能问答系统包括标准问数据库,该信息处理方法包括:执行用户问题与该标准问数据库的语义相似度计算以确定该用户问题是否被定位至该标准问数据库中的标准问;响应于该用户问题未被定位至该标准问数据库中的标准问判断该用户问题是否包括口语化表述;响应于该用户问题包括口语化表述对该用户问题进行语句调整;以及用经语句调整后的用户问题执行与该标准问数据库的相似度计算来定位标准问。在一实例中,该判断该用户问题是否包括口语化表述:对该用户问题分词以得到多个词;对照口语数据库以查找该用户问题是否包括属于口语化表述的词。在一实例中,该对用户问题进行语句调整包括:对该多个词中属于该口语化表述的词进行口语校正处理,该口语校正处理包括词序颠倒、删除、替换中的任意一者或任意组合。在一实例中,该口语化表述包括词序颠倒的连续两个单字词,该对该多个词进行口语校正处理具体包括:对该多个词中的词序颠倒的连续两个单字词进行调序处理,以构成一个新词。在一实例中,该口语化表述包括口语语气词,该对该多个词进行口语校正处理包括:将介于第一词和第二词之间的口语语气词删除;以及将该第一词和该第二词组合在一起以构成一个新词。在一实例中,该口语语气词包括以下一者或多者:的、个、了、一个、一下、下。在一实例中,该口语化表述包括口语否定词,该对该多个词进行口语校正处理具体包括:用正式否定词来替换该口语否定词;将分别位于口语否定词前后的第三词和第四词组合在一起构成一个新词;以及将该正式否定词放置在所构成的新词之前。在一实例中,该口语否定词包括以下一者或多者:不了、不上。根据本专利技术的另一方面,提供了一种智能问答系统的信息处理装置,该智能问答系统包括标准问数据库,该信息处理装置包括:语义相似度计算模块,用于执行用户问题与该标准问数据库的语义相似度计算以确定该用户问题是否被定位至该标准问数据库中的标准问;口语判断模块,用于响应于该用户问题未被定位至该标准问数据库中的标准问判断该用户问题是否包括口语化表述;以及语句调整模块,用于响应于该用户问题包括口语化表述对该用户问题进行语句调整,其中该语义相似度计算模块还用经语句调整后的用户问题执行与该标准问数据库的相似度计算来定位标准问。在一实例中,该口语判断模块包括:分词模块,用于对该用户问题分词以得到多个词;以及查找模块,用于对照口语数据库以查找该用户问题是否包括属于口语化表述的词。在一实例中,该语句调整模块包括:口语校正模块,用于对该多个词中属于该口语化表述的词进行口语校正处理,该口语校正处理包括词序颠倒、删除、替换中的任意一者或任意组合。在一实例中,该口语化表述包括词序颠倒的连续两个单字词,该口语校正模块包括:词序编辑模块,用于对该多个词中的词序颠倒的连续两个单字词进行调序处理,以构成一个新词。在一实例中,该口语化表述包括口语语气词,该口语校正模块包括:删除模块,用于将介于第一词和第二词之间的口语语气词删除;以及重组模块,用于将该第一词和该第二词组合在一起以构成一个新词。在一实例中,该口语化表述包括口语否定词,该口语校正模块包括:替换模块,用于用正式否定词来替换该口语否定词;重组模块,用于将分别位于口语否定词前后的第三词和第四词组合在一起构成一个新词;以及词序编辑模块,用于将该正式否定词放置在所构成的新词之前。由于用户问题经过了调整,那些包括口语化表述以致无法识别的用户问题就可以精确定位至对应的标准问,从而可以极大地提高智能问答系统的答复正确率,并且可以加快知识运维效率,降低知识运维的人工成本。附图说明在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本专利技术的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。图1是示出了根据本专利技术的一方面的智能问答系统的信息处理方法的流程图;以及图2是示出了根据本专利技术的一方面的智能问答系统的信息处理装置的框图。具体实施方式以下结合附图和具体实施例对本专利技术作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本专利技术的保护范围进行任何限制。知识库中的基本知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对。在本专利技术中,“标准问”是用来表示某个知识点的文字,主要目标是表达清晰,便于维护。例如,“彩铃的资费”就是表达清晰的标准问描述。这里的“问”不应被狭义地理解为“询问”,而应广义地来理解一“输入”,该“输入”具有对应的“输出”。例如,对于用于控制系统的语义识别而言,用户的一个指令,例如“打开收音机”也应可以被理解为是一个“问”,此时对应的“答”可以是用于执行相应控制的控制程序的调用。用户在向机器输入时,最理想的情况是使用标准问,则机器的智能语义识别系统马上能够理解用户的意思。但是,往往用户使用的问题与标准问有一定差异。因此,实践中,会对用户问题与标准问执行语义相似度计算,只要语义相似度达到一定程度,则认为用户所问的本文档来自技高网...

【技术保护点】
一种智能问答系统的信息处理方法,所述智能问答系统包括标准问数据库,所述信息处理方法包括:执行用户问题与所述标准问数据库的语义相似度计算以确定所述用户问题是否被定位至所述标准问数据库中的标准问;响应于所述用户问题未被定位至所述标准问数据库中的标准问判断所述用户问题是否包括口语化表述;响应于所述用户问题包括口语化表述对所述用户问题进行语句调整;以及用经语句调整后的用户问题执行与所述标准问数据库的相似度计算来定位标准问。

【技术特征摘要】
1.一种智能问答系统的信息处理方法,所述智能问答系统包括标准问数
据库,所述信息处理方法包括:
执行用户问题与所述标准问数据库的语义相似度计算以确定所述用户问
题是否被定位至所述标准问数据库中的标准问;
响应于所述用户问题未被定位至所述标准问数据库中的标准问判断所述
用户问题是否包括口语化表述;
响应于所述用户问题包括口语化表述对所述用户问题进行语句调整;以及
用经语句调整后的用户问题执行与所述标准问数据库的相似度计算来定
位标准问。
2.如权利要求1所述的信息处理方法,其特征在于,所述判断所述用户
问题是否包括口语化表述:
对所述用户问题分词以得到多个词;
对照口语数据库以查找所述用户问题是否包括属于口语化表述的词。
3.如权利要求2所述的信息处理方法,其特征在于,所述对用户问题进
行语句调整包括:
对所述多个词中属于所述口语化表述的词进行口语校正处理,所述口语校
正处理包括词序颠倒、删除、替换中的任意一者或任意组合。
4.如权利要求3所述的信息处理方法,其特征在于,所述口语化表述包
括词序颠倒的连续两个单字词,所述对所述多个词进行口语校正处理具体包
括:
对所述多个词中的词序颠倒的连续两个单字词进行调序处理,以构成一个
新词。
5.如权利要求3所述的信息处理方法,其特征在于,所述口语化表述包
括口语语气词,所述对所述多个词进行口语校正处理包括:
将介于第一词和第二词之间的口语语气词删除;以及
将所述第一词和所述第二词组合在一起以构成一个新词。
6.如权利要求5所述的信息处理方法,其特征在于,所述口语语气词包
括以下一者或多者:的、个、了、一个、一下、下。
7.如权利要求3所述的信息处理方法,其特征在于,所述口语化表述包
括口语否定词,所述对所述多个词进行口语校正处理具体包括:
用正式否定词来替换所述口语否定词;
将分别位于口语否定词前后的第三词和第四词组合在一起构成一个新词;
以及
将所述正式否定词放置在所构成的新词之前。
8.如权利要求7所述的信息处理方法,其特征在于,所述口语否定词包
括以下一者...

【专利技术属性】
技术研发人员:曾永梅李波朱频频
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1