【技术实现步骤摘要】
询问应答方法、询问应答装置及计算机可读存储介质
本专利技术涉及基于语义理解的询问应答方法、询问应答装置及计算机可读存储介质。
技术介绍
目前,模糊语义理解是信息检索及语义分析中一个非常普遍的问题,如果不能很好的对其进行语义的识别,返回的结果很大可能不是用户想要的结果。语音输入正成为越来越普遍的交互方式,虽然得益于计算能力的提升和大量数据的累积,深度学习的使用大幅降低了识别错误率,但仍然有4%-5%的错误率,在某些新词频出的领域尤为严重,这就使得模糊语义理解显得很重要。另外一方面,由于信息大爆炸,人的记忆力有限,在很多时候可能无法精确说出全部的信息,这也使得模糊语义理解成为系统的一个必要的部分。针对上述问题,申请公布号为CN106294875A的中国专利申请提出一种实体模糊检索方法和系统,但该方法较为简单,没有考虑到拼音纠错之类的因素,难以解决目前模糊语义理解的问题。另有,申请公布号为CN101206673A的中国专利申请提出一种网络搜索过程中关键词的智能纠错系统及方法。该系统是应用在互联网络平台上,建立语言模型、对应的词典和数据索引数据库,计算音字错误和模糊匹配计算词型纠错,对结果进行相关度过滤和排序,得到最接近的几个结果。该方法是用于网络搜索,不能适用于多轮对话中的模糊检索,不能解决模糊音的纠错,不能解决多轮对话里状态迁移的问题,不能解决检索结果不存在最优情况下的纠错,也没有对没有结果时如何作处理进行定义,还有纠错结果对显示的影响,如提示信息等等。
技术实现思路
鉴于现有技术中的上述问题研发了本专利技术。本专利技术旨在提供一种可以进行模糊语义理解的系统和方法 ...
【技术保护点】
一种基于语义理解的询问应答方法,所述询问应答方法包括:语义处理步骤(S101),对用户输入的询问信息进行语义处理,以生成反应询问信息的询问目的的用户意图和用于根据询问信息进行检索所用的检索信息;检索步骤(S102),基于所述检索信息,从数据库中进行基于分词的数据检索,获得候选实体数据的列表;排序步骤(S103),基于候选实体数据与用户意图之间的相关度,对候选实体数据进行排序处理;以及第一结果确定步骤(S104),将列表中具有最高相关度的候选实体数据,确定为针对用户询问信息的应答结果。
【技术特征摘要】
1.一种基于语义理解的询问应答方法,所述询问应答方法包括:语义处理步骤(S101),对用户输入的询问信息进行语义处理,以生成反应询问信息的询问目的的用户意图和用于根据询问信息进行检索所用的检索信息;检索步骤(S102),基于所述检索信息,从数据库中进行基于分词的数据检索,获得候选实体数据的列表;排序步骤(S103),基于候选实体数据与用户意图之间的相关度,对候选实体数据进行排序处理;以及第一结果确定步骤(S104),将列表中具有最高相关度的候选实体数据,确定为针对用户询问信息的应答结果。2.根据权利要求1所述的询问应答方法,其中,所述语义处理步骤(S101)包括:用户意图识别步骤(S1011),对询问信息进行用户意图识别,获得对应于询问信息的用户意图;实体识别步骤(S1012),通过预先训练的实体模型,从询问信息中识别出实体数据;以及语义理解步骤(S1013),通过预先训练的语义模型,对询问信息进行语义理解,以获得检索信息。3.根据权利要求2所述的询问应答方法,所述询问应答方法在所述排序步骤(S103)之后还包括:第一判断步骤(S204),根据相似距离计算列表中具有最高相关度的候选实体数据与询问信息之间的第一相关度,并判断第一相关度是否小于第一阈值;以及第二结果确定步骤(S206),在所述第一判断步骤中判断第一相关度小于第一阈值的情况下,将在所述实体识别步骤中识别出的实体数据,确定为应答结果。4.根据权利要求3所述的询问应答方法,所述询问应答方法在所述第一确定步骤之后还包括:第二判断步骤(S205),判断第一相关度是否大于第二阈值,其中,在所述第二判断步骤中判断第一相关度大于第二阈值的情况下,在所述第一结果确定步骤中,将具有最高相关度的候选实体数据,确定为应答结果,并且其中,所述相似距离包括拼音的编辑距离、字的编辑距离和语义的编辑距离中的至少一者。5.根据权利要求1至4中任一项所述的询问应答方法,其中,所述排序步骤(S103)包括:相关度计算步骤(S1031),根据GBDT模型计算候选实体数据与用户意图之间的相关度;以及相关度排序步骤(S1032),基于计算出的相关度,对候选实体数据进行排序。6.根据权利要求1至4中任一项所述的询问应答方法,所述询问应答方法在所述语义处理步骤(S101)之前还包括:预处理及纠错步骤(S301),对询问信息进行预处理,并且通过预先训练的词纠错模型,对经过预处理的询问信息进行纠错处理。7.根据权利要求6所述的询问应答方法,所述预处理包括对询问信息中包含的停用词和口语词的删除、以及对询问信息中包含的字母和数字的大小写转换。8.根据权利要求1至4中任一项所述的询问应答方法,其中,所述检索信息采用槽值对的形式。9.根据权利要求1至4中任一项所述的询问应答方法,所述询问信息为用户输入的文本信息、通过转换用户输入的语音信息而生成的文本信息、以及用户输入的文本信息与将用户语音信息转换成的文本组合而成的文本信息中的一种。10.一种基于语义理解的询问应答装置,所述询问应答装置包括:语义处理单元(1101),对用户输入的询问信息进行语义处理,以生成反应询问信息的询问目的的用户意图和用于根据询问信息进行检索所用的检索信息;检索单元(1102),基于所述检索信息,从数据库中进行基于分词的数据检索,获得候选实体数据的列表;排序单元(1103),基于候选实体数据与用户意图之间的相关度,对候选实体数据进行排序处理;以及第一结果确定单元(1104),将列表中具有最高相关度的候选...
【专利技术属性】
技术研发人员:陈华荣,亓超,王卓然,马宇驰,
申请(专利权)人:三角兽北京科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。