问答意图识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:31746836 阅读:21 留言:0更新日期:2022-01-05 16:26
本发明专利技术实施例公开了问答意图识别方法、装置、计算机设备及存储介质。方法包括:采用聚类对各种问答句子样本进行处理,以构建语料问答库;获取问题语句;抽取问题语句的关键词;根据关键词与语料问答库进行匹配,以得到匹配结果;判断匹配结果是否是有对应的答案;若匹配结果是有对应的答案,则将答案输出至终端;若匹配结果不是有对应的答案,则对问题语句进行分类,以得到语句类别;计算问题语句以及语料问答库内语句类别对应的句子集内每个句子的相似度,以得到计算结果;输出计算结果中相似程度符合要求的句子至终端。通过实施本发明专利技术实施例的方法可实现在进行语音问答意图识别时,可缩小计算量,提高响应效率,快速输出问题对应的答案。应的答案。应的答案。

【技术实现步骤摘要】
问答意图识别方法、装置、计算机设备及存储介质


[0001]本专利技术涉及计算机,更具体地说是指问答意图识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]语音交流是人与人之间进行交流互动的最便捷、最准确和最自然的途径之一,基于语音的人机交互技术研究涵盖了广泛的研究领域,包括语言韵律学、语音产生于感知、音频信号处理、语音合成、语音识别、自然语言理解、机器翻译等等,其中,语音合成、语音识别和自然语言理解在人机交互语音技术中处于非常核心的关键技术。在这三者中,AI(人工智能,Artificial Intelligence)语音智能就是把人的语音转换成相应的文本、命令以便计算机进行理解、产生相应操作的自动语音识别技术是最重要、最困难的核心技术。
[0003]在进行人机交互过程中,需要进行语音识别,但是语音信号会受到上下文的影响而发生变化;发音人以及口音的不同会导致语音特征在参数空间分布的不同;同一发音人心理和生理变化带来的语音变化;不同的发音方式和习惯引起的省略、连读等多变的语音现象;环境和信道等因素造成的语音信号失真问题。这些语音识别中需要考虑和处理的诸多可变因素;机器在处理语音问答时,需要进行语义匹配,以输出用户想要得到的答案,但是现有的识别方式计算量大,耗时且繁琐,导致响应时间慢。
[0004]因此,有必要设计一种新的方法,实现在进行语音问答意图识别时,可缩小计算量,提高响应效率,快速输出问题对应的答案。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的缺陷,提供问答意图识别方法、装置、计算机设备及存储介质。
[0006]为实现上述目的,本专利技术采用以下技术方案:问答意图识别方法,包括:
[0007]采用聚类对各种问答句子样本进行处理,以构建语料问答库;
[0008]获取问题语句;
[0009]抽取所述问题语句的关键词;
[0010]根据所述关键词与所述语料问答库进行匹配,以得到匹配结果;
[0011]判断所述匹配结果是否是有对应的答案;
[0012]若所述匹配结果是有对应的答案,则将所述答案输出至终端;
[0013]若所述匹配结果不是有对应的答案,则对所述问题语句进行分类,以得到语句类别;
[0014]计算所述问题语句以及所述语料问答库内所述语句类别对应的句子集内每个句子的相似度,以得到计算结果;
[0015]输出计算结果中相似程度符合要求的句子至终端。
[0016]其进一步技术方案为:所述采用聚类对各种问答句子样本进行处理,以构建语料
问答库,包括:
[0017]获取各种问答句子样本;
[0018]对各种问答句子样本进行K

Means聚类,以得到样本的类别;
[0019]根据样本的类别构建语料问答库。
[0020]其进一步技术方案为:所述根据所述关键词与所述语料问答库进行匹配,以得到匹配结果,包括:
[0021]确定所述语料问答库内的类别的关键词,以得到句子集以及对应的关键词库;
[0022]将所述关键词与所述关键词库进行匹配,以确定所述关键词库与所述关键词一致的词语;
[0023]确定所述词语对应的句子,并确定匹配结果是有对应的答案。
[0024]其进一步技术方案为:所述确定所述语料问答库内的类别的关键词,以得到子类集以及对应的关键词库,包括:
[0025]将所述语料问答库内各个类别对应的问答句子样本转换为向量空间化矩阵,以确定各个类别对应的句子集以及对应的关键词库。
[0026]其进一步技术方案为:所述计算所述问题语句以及所述语料问答库内所述语句类别对应的句子集内每个句子的相似度,以得到计算结果,包括:
[0027]确定所述语句类别对应的句子集的每个句子,以得到目标句子;
[0028]采用jieba分词以及余弦相似度计算方式计算所述问题语句与所述目标句子的相似度,以得到计算结果。
[0029]其进一步技术方案为:所述输出计算结果中相似程度符合要求的句子至终端,包括:
[0030]按照计算结果的数值从高到低的顺序进行目标句子的排序,以得到排序结果;
[0031]筛选所述排序结果的前三位对应的目标句子,以得到相似程度符合要求的句子;
[0032]输出相似程度符合要求的句子至终端。
[0033]本专利技术还提供了问答意图识别装置,包括:
[0034]问答库构建单元,用于采用聚类对各种问答句子样本进行处理,以构建语料问答库;
[0035]问题语句获取单元,用于获取问题语句;
[0036]关键词抽取单元,用于抽取所述问题语句的关键词;
[0037]关键词匹配单元,用于根据所述关键词与所述语料问答库进行匹配,以得到匹配结果;
[0038]结果判断单元,用于判断所述匹配结果是否是有对应的答案;
[0039]第一输出单元,用于若所述匹配结果是有对应的答案,则将所述答案输出至终端;
[0040]分类单元,用于若所述匹配结果不是有对应的答案,则对所述问题语句进行分类,以得到语句类别;
[0041]相似度计算单元,用于计算所述问题语句以及所述语料问答库内所述语句类别对应的句子集内每个句子的相似度,以得到计算结果;
[0042]第二输出单元,用于输出计算结果中相似程度符合要求的句子至终端。
[0043]其进一步技术方案为:所述问答库构建单元包括:
[0044]样本获取子单元,用于获取各种问答句子样本;
[0045]聚类子单元,用于对各种问答句子样本进行K

Means聚类,以得到样本的类别;
[0046]构建子单元,用于根据样本的类别构建语料问答库。
[0047]本专利技术还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
[0048]本专利技术还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述的方法。
[0049]本专利技术与现有技术相比的有益效果是:本专利技术通过采用聚类方式对各种问答句子样本进行处理,构建语料问答库,当输入的问题语句的关键词在语料问答库对应的类别内能匹配到句子,将句子作为答案输出,无需遍历语料问答库内的所有句子,减少计算量;当不能匹配到句子时,采用大致分类后确定句子集,在计算句子集内的句子与问题语句的相似度,以确定答案,实现在进行语音问答意图识别时,可缩小计算量,提高响应效率,快速输出问题对应的答案。
[0050]下面结合附图和具体实施例对本专利技术作进一步描述。
附图说明
[0051]为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.问答意图识别方法,其特征在于,包括:采用聚类对各种问答句子样本进行处理,以构建语料问答库;获取问题语句;抽取所述问题语句的关键词;根据所述关键词与所述语料问答库进行匹配,以得到匹配结果;判断所述匹配结果是否是有对应的答案;若所述匹配结果是有对应的答案,则将所述答案输出至终端;若所述匹配结果不是有对应的答案,则对所述问题语句进行分类,以得到语句类别;计算所述问题语句以及所述语料问答库内所述语句类别对应的句子集内每个句子的相似度,以得到计算结果;输出计算结果中相似程度符合要求的句子至终端。2.根据权利要求1所述的问答意图识别方法,其特征在于,所述采用聚类对各种问答句子样本进行处理,以构建语料问答库,包括:获取各种问答句子样本;对各种问答句子样本进行K

Means聚类,以得到样本的类别;根据样本的类别构建语料问答库。3.根据权利要求2所述的问答意图识别方法,其特征在于,所述根据所述关键词与所述语料问答库进行匹配,以得到匹配结果,包括:确定所述语料问答库内的类别的关键词,以得到句子集以及对应的关键词库;将所述关键词与所述关键词库进行匹配,以确定所述关键词库与所述关键词一致的词语;确定所述词语对应的句子,并确定匹配结果是有对应的答案。4.根据权利要求3所述的问答意图识别方法,其特征在于,所述确定所述语料问答库内的类别的关键词,以得到子类集以及对应的关键词库,包括:将所述语料问答库内各个类别对应的问答句子样本转换为向量空间化矩阵,以确定各个类别对应的句子集以及对应的关键词库。5.根据权利要求1所述的问答意图识别方法,其特征在于,所述计算所述问题语句以及所述语料问答库内所述语句类别对应的句子集内每个句子的相似度,以得到计算结果,包括:确定所述语句类别对应的句子集的每个句子,以得到目标句子;采用jieba分词以及余弦相似度计算方式计算所述问题...

【专利技术属性】
技术研发人员:何明华赵康王一科贾林涂静一
申请(专利权)人:深圳科卫机器人科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1