询问应答方法、询问应答装置及计算机可读存储介质制造方法及图纸

技术编号:16529085 阅读:26 留言:0更新日期:2017-11-09 20:52
本发明专利技术提供一种询问应答方法、询问应答装置及计算机可读存储介质,该询问应答方法包括:语义处理步骤(S101),对用户输入的询问信息进行语义处理,以生成反应询问信息的询问目的的用户意图和用于根据询问信息进行检索所用的检索信息;检索步骤(S102),基于所述检索信息,从数据库中进行基于分词的数据检索,获得候选实体数据的列表;排序步骤(S103),基于候选实体数据与用户意图之间的相关度,对候选实体数据进行排序处理;以及第一结果确定步骤(S104),将列表中具有最高相关度的候选实体数据,确定为针对用户询问信息的应答结果。

【技术实现步骤摘要】
询问应答方法、询问应答装置及计算机可读存储介质
本专利技术涉及基于语义理解的询问应答方法、询问应答装置及计算机可读存储介质。
技术介绍
目前,模糊语义理解是信息检索及语义分析中一个非常普遍的问题,如果不能很好的对其进行语义的识别,返回的结果很大可能不是用户想要的结果。语音输入正成为越来越普遍的交互方式,虽然得益于计算能力的提升和大量数据的累积,深度学习的使用大幅降低了识别错误率,但仍然有4%-5%的错误率,在某些新词频出的领域尤为严重,这就使得模糊语义理解显得很重要。另外一方面,由于信息大爆炸,人的记忆力有限,在很多时候可能无法精确说出全部的信息,这也使得模糊语义理解成为系统的一个必要的部分。针对上述问题,申请公布号为CN106294875A的中国专利申请提出一种实体模糊检索方法和系统,但该方法较为简单,没有考虑到拼音纠错之类的因素,难以解决目前模糊语义理解的问题。另有,申请公布号为CN101206673A的中国专利申请提出一种网络搜索过程中关键词的智能纠错系统及方法。该系统是应用在互联网络平台上,建立语言模型、对应的词典和数据索引数据库,计算音字错误和模糊匹配计算词型纠错,对结果进行相关度过滤和排序,得到最接近的几个结果。该方法是用于网络搜索,不能适用于多轮对话中的模糊检索,不能解决模糊音的纠错,不能解决多轮对话里状态迁移的问题,不能解决检索结果不存在最优情况下的纠错,也没有对没有结果时如何作处理进行定义,还有纠错结果对显示的影响,如提示信息等等。
技术实现思路
鉴于现有技术中的上述问题研发了本专利技术。本专利技术旨在提供一种可以进行模糊语义理解的系统和方法,当用户因为语音语调、错误模糊的表达或者记不清等问题发出不准确的指令时,系统仍能作出正确的语义理解并在此基础上顺利完成信息检索。它适用于所有的需要模糊纠错的场景,包括网络搜索的语义纠错,和多轮对话中的模糊语义纠错。本专利技术的第一方面提供一种基于语义理解的询问应答方法,所述询问应答方法包括:语义处理步骤(S101),对用户输入的询问信息进行语义处理,以生成反应询问信息的询问目的的用户意图和用于根据询问信息进行检索所用的检索信息;检索步骤(S102),基于所述检索信息,从数据库中进行基于分词的数据检索,获得候选实体数据的列表;排序步骤(S103),基于候选实体数据与用户意图之间的相关度,对候选实体数据进行排序处理;以及第一结果确定步骤(S104),将列表中具有最高相关度的候选实体数据,确定为针对用户询问信息的应答结果。本专利技术的第二方面提供一种基于语义理解的询问应答装置,所述询问应答装置包括:语义处理单元(1101),对用户输入的询问信息进行语义处理,以生成反应询问信息的询问目的的用户意图和用于根据询问信息进行检索所用的检索信息;检索单元(1102),基于所述检索信息,从数据库中进行基于分词的数据检索,获得候选实体数据的列表;排序单元(1103),基于候选实体数据与用户意图之间的相关度,对候选实体数据进行排序处理;以及第一结果确定单元(1104),将列表中具有最高相关度的候选实体数据,确定为针对用户询问信息的应答结果。本专利技术的第三方面提供一种基于语义理解的询问应答系统(100),所述系统包括用户终端(1001)和与用户终端连接的服务器(1002),所述用户终端包括:输入接受单元(10011),接受用户输入的询问信息;语义处理单元(10012),对询问信息进行语义处理,以生成反应询问信息的询问目的的用户意图和用于根据询问信息进行检索所用的检索信息;发送单元(10013),将询问信息、该询问信息的用户意图和检索信息以相关联的方式发送给服务器,并从服务器接收针对询问信息的应答结果,所述服务器包括:接收单元(10021),从用户终端接收询问信息和与该询问信息相关联的用户意图和检索信息;检索单元(10022),基于所述检索信息,从数据库中进行基于分词的数据检索,获得候选实体数据的列表;排序单元(10023),基于候选实体数据与用户意图之间的相关度,对候选实体数据进行排序;以及结果确定单元(10024),将列表中具有最高相关度的候选实体数据,确定为针对用户询问信息的应答结果,并将应答结果发送给用户终端。本专利技术的第四方面提供一种计算机可读存储介质,其存储计算机程序,所述计算机程序在被处理器执行时,实现根据上述询问应答方法中包括的步骤。根据本专利技术,即使由于用户记忆模糊等问题而输入错误的询问信息,也能够顺利的完成信息检索,使得用户能够获得与用户的意图更接近的检索结果。另外,即使在不存在最优检索结果的情况下,也能够进行纠错,并向用户提供纠错后的结果。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域或普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是示出本专利技术中的询问应答装置的硬件构造的图。图2是例示根据本专利技术第一实施例的询问应答方法的流程图。图3是例示根据本专利技术的询问应答方法的语义处理步骤的流程图。图4是例示根据本专利技术的询问应答方法的排序步骤的流程图。图5是例示根据第一实施例的询问应答装置的软件结构的框图。图6是例示根据本专利技术第二实施例的询问应答方法的流程图。图7是例示根据第二实施例的询问应答装置的软件结构的框图。图8是例示根据本专利技术优选实施例的询问应答方法的流程图。图9是例示根据优选实施例的询问应答装置的软件结构的框图。图10是例示本专利技术的询问应答系统的示意图。具体实施方式在下文中将参照附图详细地描述本专利技术的实施例。应当理解,下述实施例并不意图限制本专利技术,并且,关于根据本专利技术的解决问题的手段,并不一定需要根据下述实施例描述的各方面的全部组合。为简化起见,对相同的结构部分或者步骤,使用了相同的标记或标号,并且省略其说明。[询问应答装置的硬件结构]图1是示出本专利技术中的询问应答装置的硬件构造的图。在本实施例中,以智能电话作为询问应答装置的示例给出描述。但请注意,虽然在本实施例中例举了智能电话作为询问应答装置1000,但是显然不限于此,本专利技术的询问应答装置可以是移动终端(智能手机、智能手表、智能手环、音乐播放设备)、笔记本电脑、平板电脑、PDA(个人数字助理)、传真装置、打印机、或者是具有询问应答功能的互联网设备(例如数字照相机、电冰箱、电视机等)等各种装置。首先,参照图1的框图描述询问应答装置1000(2000、3000)的硬件结构。此外,在本实施例中作为示例描述了以下构造,但是本专利技术的询问应答装置不限于图1所示的构造。询问应答装置1000包括经由系统总线彼此连接的输入接口101、CPU102、ROM103、RAM105、存储装置106、输出接口104、通信单元107和短距离无线通信单元108和显示单元109。输入接口101是用于接收用户所输入的数据以及功能的执行指令的接口,并且是用于经由诸如麦克风、按键、按钮或触摸屏的操作单元(未示出)接收从用户输入的数据和操作指令的接口。请注意,稍后描述的显示单元109和操作单元可以至少部分地集成,并且,例如,可以是在同一画面中进行画面输出和接收用户操作的构造。CPU102是系统控制单元本文档来自技高网...
询问应答方法、询问应答装置及计算机可读存储介质

【技术保护点】
一种基于语义理解的询问应答方法,所述询问应答方法包括:语义处理步骤(S101),对用户输入的询问信息进行语义处理,以生成反应询问信息的询问目的的用户意图和用于根据询问信息进行检索所用的检索信息;检索步骤(S102),基于所述检索信息,从数据库中进行基于分词的数据检索,获得候选实体数据的列表;排序步骤(S103),基于候选实体数据与用户意图之间的相关度,对候选实体数据进行排序处理;以及第一结果确定步骤(S104),将列表中具有最高相关度的候选实体数据,确定为针对用户询问信息的应答结果。

【技术特征摘要】
1.一种基于语义理解的询问应答方法,所述询问应答方法包括:语义处理步骤(S101),对用户输入的询问信息进行语义处理,以生成反应询问信息的询问目的的用户意图和用于根据询问信息进行检索所用的检索信息;检索步骤(S102),基于所述检索信息,从数据库中进行基于分词的数据检索,获得候选实体数据的列表;排序步骤(S103),基于候选实体数据与用户意图之间的相关度,对候选实体数据进行排序处理;以及第一结果确定步骤(S104),将列表中具有最高相关度的候选实体数据,确定为针对用户询问信息的应答结果。2.根据权利要求1所述的询问应答方法,其中,所述语义处理步骤(S101)包括:用户意图识别步骤(S1011),对询问信息进行用户意图识别,获得对应于询问信息的用户意图;实体识别步骤(S1012),通过预先训练的实体模型,从询问信息中识别出实体数据;以及语义理解步骤(S1013),通过预先训练的语义模型,对询问信息进行语义理解,以获得检索信息。3.根据权利要求2所述的询问应答方法,所述询问应答方法在所述排序步骤(S103)之后还包括:第一判断步骤(S204),根据相似距离计算列表中具有最高相关度的候选实体数据与询问信息之间的第一相关度,并判断第一相关度是否小于第一阈值;以及第二结果确定步骤(S206),在所述第一判断步骤中判断第一相关度小于第一阈值的情况下,将在所述实体识别步骤中识别出的实体数据,确定为应答结果。4.根据权利要求3所述的询问应答方法,所述询问应答方法在所述第一确定步骤之后还包括:第二判断步骤(S205),判断第一相关度是否大于第二阈值,其中,在所述第二判断步骤中判断第一相关度大于第二阈值的情况下,在所述第一结果确定步骤中,将具有最高相关度的候选实体数据,确定为应答结果,并且其中,所述相似距离包括拼音的编辑距离、字的编辑距离和语义的编辑距离中的至少一者。5.根据权利要求1至4中任一项所述的询问应答方法,其中,所述排序步骤(S103)包括:相关度计算步骤(S1031),根据GBDT模型计算候选实体数据与用户意图之间的相关度;以及相关度排序步骤(S1032),基于计算出的相关度,对候选实体数据进行排序。6.根据权利要求1至4中任一项所述的询问应答方法,所述询问应答方法在所述语义处理步骤(S101)之前还包括:预处理及纠错步骤(S301),对询问信息进行预处理,并且通过预先训练的词纠错模型,对经过预处理的询问信息进行纠错处理。7.根据权利要求6所述的询问应答方法,所述预处理包括对询问信息中包含的停用词和口语词的删除、以及对询问信息中包含的字母和数字的大小写转换。8.根据权利要求1至4中任一项所述的询问应答方法,其中,所述检索信息采用槽值对的形式。9.根据权利要求1至4中任一项所述的询问应答方法,所述询问信息为用户输入的文本信息、通过转换用户输入的语音信息而生成的文本信息、以及用户输入的文本信息与将用户语音信息转换成的文本组合而成的文本信息中的一种。10.一种基于语义理解的询问应答装置,所述询问应答装置包括:语义处理单元(1101),对用户输入的询问信息进行语义处理,以生成反应询问信息的询问目的的用户意图和用于根据询问信息进行检索所用的检索信息;检索单元(1102),基于所述检索信息,从数据库中进行基于分词的数据检索,获得候选实体数据的列表;排序单元(1103),基于候选实体数据与用户意图之间的相关度,对候选实体数据进行排序处理;以及第一结果确定单元(1104),将列表中具有最高相关度的候选...

【专利技术属性】
技术研发人员:陈华荣亓超王卓然马宇驰
申请(专利权)人:三角兽北京科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1