智能语音问答方法、装置、计算机设备和可读存储介质制造方法及图纸

技术编号:17265301 阅读:30 留言:0更新日期:2018-02-14 12:45
本发明专利技术提供了一种智能语音问答方法、装置、计算机设备和可读存储介质,其中,智能语音问答方法,包括:获取待回答语句;确定待回答语句的至少一个标签;在预设数据库中,根据至少一个标签确定待回答语句的匹配集合;基于K最近邻分类模型,确定与待回答语句相对应的匹配集合内的k个语句;根据预设规则计算待回答语句与k个语句中的每一语句的匹配度;根据匹配度的大小,对k个语句进行排序,并按照顺序依次输出k个语句对应的答案信息作为待回答语句的答案信息。通过本发明专利技术的技术方案,减少了答案信息抽取的范围,降低了答案抽取过程的计算量,节约了计算资源,而且,提高了答案信息抽取的准确性,提高了语音问答的智能化水平。

Intelligent voice Q & a method, device, computer equipment and readable storage medium

The invention provides an intelligent voice response method and device, device and computer readable storage medium, wherein, intelligent voice response method, including: obtaining statements to answer; to determine answer statement at least one tag; in the default database, according to the statement, answer to determine a set of at least one label; K recently neighbor classification model based on the determination and to answer, set the K statement corresponding; according to predetermined rules to compute answer statement and K statement in each statement according to the matching degree; the matching degree, sort of K statements, and in accordance with the order of output statements corresponding to the k the answer information as to answer the answer information statement. Through the technical scheme of the invention, the range of the information extraction is reduced, the computation amount of the answer extraction process is reduced, the computing resources are saved, and the accuracy of the information extraction is enhanced, and the intelligentization level of the voice question answering is improved.

【技术实现步骤摘要】
智能语音问答方法、装置、计算机设备和可读存储介质
本专利技术涉及人机智能交互
,具体而言,涉及一种智能语音问答方法、一种智能语音问答装置、一种计算机设备和一种计算机可读存储介质。
技术介绍
智能问答系统是综合运用了自然语言处理、信息检索、语义分析和人工智能等技术的一种新型的信息服务系统。相关技术中,智能问答系统大多基于开放领域和传统问答标准框架,存在以下技术缺陷:(1)开放领域的问答系统需要超大规模的知识库作基础,其直接运用到限定领域中存在着冷启动、无法匹配正确答案等问题,同时用户的检索问题大多都是口语化表述,完全依靠限定领域的资料生成模型与检索问题不符,因此很难直接获取到用户所需答案。(2)当前的问答系统大多不能够精准理解用户的自然语言问题意图,用户的情感倾向没有得到充分体现。(3)答案抽取大多是基于词频相似度的计算或其他复杂的机器学习模型,然而这种答案抽取方式不仅计算量大,而且面对高度稀疏的问题解时,答案抽取精度也将大打折扣。
技术实现思路
本专利技术旨在至少解决现有技术或相关技术中存在的技术问题之一。为此,本专利技术的一个目的在于提供一种智能语音问答方法。本专利技术的另一个目的在于提供一种智能语音问答装置。本专利技术的再一个目的在于提供一种计算机设备。本专利技术的又一个目的在于提供一种计算机可读存储介质。为了实现上述目的,本专利技术的第一方面的技术方案提供了一种智能语音问答方法,包括:获取待回答语句;确定待回答语句的至少一个标签;在预设数据库中,根据至少一个标签确定待回答语句的匹配集合;基于K最近邻分类模型,确定与待回答语句相对应的匹配集合内的k个语句;根据预设规则计算待回答语句与k个语句中的每一语句的匹配度;根据匹配度的大小,对k个语句进行排序,并按照顺序依次输出k个语句对应的答案信息作为待回答语句的答案信息。在该技术方案中,通过确定获取到的待回答语句的至少一个标签,然后在预设数据库中,根据至少一个标签确定待回答语句的匹配集合,提高了对用户问询意图识别的准确度,缩小了答案信息的抽取范围,提高答案信息抽取的准确性,通过基于K最近邻分类模型,确定与待回答语句相对应的匹配集合内的k个语句,进一步找到了待回答语句的匹配邻近k个语句,有利于进一步节约后台计算资源,通过根据预设规则计算待回答语句与k个语句中的每一语句的匹配度,提高了匹配度的准确性,通过根据匹配度的大小,对k个语句进行排序,并按照顺序依次输出k个语句对应的答案信息作为待回答语句的答案信息,进一步提高了答案信息抽取的准确性,进而提升了语音问答的智能化水平。其中,获取待回答语句时,可以设为接收限定时间的语音输入,比如时间限定为30s,使得待回答语句为短文本类型的语句,可以有利于准确抽取答案信息的实现。另外,确定的待回答语句的标签可以是句法标签,情感标签,领域标签中的一个,也可以句法标签,情感标签,领域标签的任意组合。句法标签是根据预先构建训练的句法标签预测模型预测确定的;情感标签可以根据待回答语句中词与预设的情感词库中词的匹配度确定是正向还是负向,也可以根据预先构建训练的情感标签预测模型来确定是正向还是负向,还可以给上述两种确定方式预设权重来综合确定情感标签是正向还是负向,比如第一种方式中正向为0.8,负向为0.2,第二种方式正向为0.6,负向为0.4,第一种方式的权重0.5,第二种方式的权重0.5,则综合两种方式后正向为0.7,负向为0.3,那么待回答语句的情感标签就是正向;领域标签是通过长短记忆型递归神经网络模型、卷积神经网络模型和softmax回归模型来确定的,充分利用长短记忆型递归神经网络模型善于获取语序信息的优点和卷积神经网络模型善于特征提取和抽象化的优点。在预设数据库中,根据至少一个标签确定待回答语句的匹配集合时,可以根据实际运用情况为每种标签预设权重,比如句法标签权重0.3,情感标签权重0.2,领域标签权重0.5,以加权后满足一定条件的相应语句形成匹配集合。除此之外,在输出答案信息时,可以是文本也可以是语音,可以融合一定的软语,以增加可读性,然后通过语音合成输出,答案信息还可以是食谱、图片等,会根据答案信息类型的不同进行相应的推送。在上述技术方案中,优选地,预设规则,包括:确定待回答语句与k个语句中的每一语句的词形匹配度;确定待回答语句或k个语句中的每一语句与标准词序的词序匹配度;根据词形匹配度和词序匹配度,确定匹配度。在该技术方案中,通过根据确定的待回答语句与k个语句中的每一语句的词形匹配度,和确定的待回答语句或k个语句中的每一语句与标准词序的词序匹配度,来确定匹配度,综合了待回答语句的统计特征和语义信息,能够更加全面准确地衡量匹配度。在上述任一项技术方案中,优选地,根据词形匹配度和词序匹配度,确定匹配度,包括:预设词形匹配度的权重为第一权重值;预设词序匹配度的权重为第二权重值,其中,第一权重值与第二权重值的加和等于1;根据第一计算公式,确定匹配度,其中,第一计算公式为SenSim(x)=λ1×TermSim(x,y)+λ2×{Order_sim(baseline,y)}k,TermSim(x,y)为词形匹配度,λ1为第一权重值,Order_sim(baseline,y)为词序匹配度,λ2为第二权重值,k为k个语句,SenSim(x)为匹配度。在该技术方案中,通过第一计算公式确定匹配度,进一步提高了匹配度确定的全面性和准确性,其中,预设词形匹配度的权重为第一权重值,预设词序匹配度的权重为第二权重值,第一权重值和第二权重值可以依据实际需要方便调整,使用更加便捷。为了提高第一计算公式对匹配度确定的准确性,第一权重值和第二权重值可以根据大量样本,采用基于机器的学习方式来确定,具体如下:根据收集到的样本集,采用基于机器的学习方式,将样本集进行迭代更新,分别以λ1=0.1,λ2=0.99开始迭代,迭代次数为100次,在迭代过程中,将迭代模型的输入值与输出值进行对比,对比结果差异性最小的λ1与λ2,作为对应的确定词形匹配度的第一权重值与词序匹配度的第二权重值,一方面,实现了权重值的最优化选择,另一方面,可以依据实际需要方便调整权重的占有值,使用更加便捷。具体地,匹配度至少包括词形匹配度、词序匹配度的线性和,基于机器学习的方式确定λ1(第一权重值)与λ2(第二权重值),主要包括:(1)收集文本数据集,并对文本进行预处理,处理过程包括中文分词、去停用词、文本特征化、文本去重、文本自定义词典配置等步骤;(2)将预处理后的文本入库,并对每个文本样本进行标记,以确定最相似的文本,通过最相似的文本模型训练,并根据预设的切割比例,如7:3,将文本分配给训练集、测试集;(3)采用机器学习算法,比如KNN(k-NearestNeighbor,k最近邻分类算法),针对训练集建模分析,设定λ1'以0.01为起点,步长为0.01,迭代100次时(同时满足λ1'+λ2'=1),样本的精度变化范围,并以最高精度时λ1'、λ2'的数值作为最优的λ1、λ2。在上述任一项技术方案中,优选地,确定待回答语句与k个语句中的每一语句的词形匹配度,包括:根据第二计算公式,确定词形匹配度,其中,第二计算公式为x为待回答语句,y为k个语句中的任一语句,xt为待回答语句去除停用词以后的语句,yt为k本文档来自技高网...
智能语音问答方法、装置、计算机设备和可读存储介质

【技术保护点】
一种智能语音问答方法,其特征在于,包括:获取待回答语句;确定所述待回答语句的至少一个标签;在预设数据库中,根据所述至少一个标签确定所述待回答语句的匹配集合;基于K最近邻分类模型,确定与所述待回答语句相对应的所述匹配集合内的k个语句;根据预设规则计算所述待回答语句与所述k个语句中的每一语句的匹配度;根据所述匹配度的大小,对所述k个语句进行排序,并按照顺序依次输出所述k个语句对应的答案信息作为所述待回答语句的答案信息。

【技术特征摘要】
1.一种智能语音问答方法,其特征在于,包括:获取待回答语句;确定所述待回答语句的至少一个标签;在预设数据库中,根据所述至少一个标签确定所述待回答语句的匹配集合;基于K最近邻分类模型,确定与所述待回答语句相对应的所述匹配集合内的k个语句;根据预设规则计算所述待回答语句与所述k个语句中的每一语句的匹配度;根据所述匹配度的大小,对所述k个语句进行排序,并按照顺序依次输出所述k个语句对应的答案信息作为所述待回答语句的答案信息。2.根据权利要求1所述的智能语音问答方法,其特征在于,所述预设规则,包括:确定所述待回答语句与所述k个语句中的每一语句的词形匹配度;确定所述待回答语句或所述k个语句中的每一语句与标准词序的词序匹配度;根据所述词形匹配度和所述词序匹配度,确定所述匹配度。3.根据权利要求2所述的智能语音问答方法,其特征在于,所述根据所述词形匹配度和所述词序匹配度,确定所述匹配度,包括:预设所述词形匹配度的权重为第一权重值;预设所述词序匹配度的权重为第二权重值,其中,所述第一权重值与所述第二权重值的加和等于1;根据第一计算公式,确定所述匹配度,其中,所述第一计算公式为SenSim(x)=λ1×TermSim(x,y)+λ2×{Order_sim(baseline,y)}k,TermSim(x,y)为所述词形匹配度,λ1为所述第一权重值,Order_sim(baseline,y)为所述词序匹配度,λ2为所述第二权重值,k为所述k个语句,SenSim(x)为所述匹配度。4.根据权利要求2所述的智能语音问答方法,其特征在于,所述确定所述待回答语句与所述k个语句中的每一语句的词形匹配度,包括:根据第二计算公式,确定所述词形匹配度,其中,所述第二计算公式为x为所述待回答语句,y为所述k个语句中的任一语句,xt为所述待回答语句去除停用词以后的语句,yt为所述k个语句中的任一语句去除停用词以后的语句,s(xt)为所述待回答语句去除所述停用词后的有效词数量,s(yt)为所述待回答语句去除所述停用词后的有效词数量,ts(xt,yt)为所述待回答语句与所述k个语句中的任一语句去除所述停用词后并去除重复词后的相同词数量,TermSim(x,y)为所述词形匹配度。5.根据权利要求2所述的智能语音问答方法,其特征在于,所述确定所述待回答语句或所述k个语句中的每一语句与标准词序的词序匹配度,包括:根据第三计算公式,确定所述词序匹配度,其中,所述第三计算公式为所述baseline为指定场景的标准词序,y为所述k个语句中的任一语句,所述invCount(y)为所述y相对于所述baseline的逆序数,所述maxInvCount(baseline)为所述baseline的最大逆序数,所述n为所述k个语句中的任一语句y的词数量。6.根据权利要求2所述的智能语音问答方法,其特征在于,在所述确定所述待回答语句或所述k个语句中的每一语句与标准词序的词序匹配度之前,还包括:根据指定场景的属性确定所述指定场景的标准词序;根据所述标准词序,生成所述指定场景的同义词库。7.根据权利要求1所述的智能语音问答方法,其特征在于,在所述确定所述待回答语句的至少一个标签之前,还包括:确定所述待回答语句中是否包括与预设场景词库相匹配的词;若确定所述待回答语句中包括与所述预设场景词库相匹配的词,则以所述预设场景词库中相匹配的词替换所述待回答语句中对应的词;若确定所述待回答语句中不包括与与所述预设场景词库相匹配的词,则发出提示信号,并终止。8.一种智能语音问答装置,其特征在于,包括:获取单元,用于获取待回答语句;确定单元,用于确定所述待回答语句的至少一个标签;所述确定单元,还用于:在预设数据库中,根据所述至少一个标签确定所述...

【专利技术属性】
技术研发人员:闫永刚沈亮
申请(专利权)人:合肥美的智能科技有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1