启发式语音交互方法及装置制造方法及图纸

技术编号:19009115 阅读:28 留言:0更新日期:2018-09-22 08:59
本发明专利技术公开了一种启发式语音交互方法及装置,其中方法包括获取用户输入的提问请求;根据所述提问语音进行声纹识别;根据所述提问语音进行语音识别;对所述提问语音数据进行自然语言理解处理;根据知识问答图谱获取与所述提问语音数据相对应的答案数据;根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数;若所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时,根据所述提问语音数据生成相对应的引导式反问数据;接收用户基于所述引导式反问数据输入的回答语音,并判断所述回答语音是否正确。该发明专利技术采用启发式语音交互方法启发引导儿童思考,弥补现有技术中智能设备与用户交互无法对思维方式进行引导教育的缺陷。

Heuristic voice interaction method and device

The invention discloses a heuristic voice interaction method and a device, wherein the method comprises acquiring a query request input by a user, voiceprint recognition based on the query voice, speech recognition based on the query voice, natural language understanding processing of the question voice data, and acquisition based on the knowledge question answering atlas. Answer data corresponding to the question voice data; input times of the same question voice input are judged according to the user identification; if the user age segment of the user matches the difficulty attribute of the question voice data, a corresponding bootstrap counter is generated according to the question voice data. Question data; the receiving user determines whether the answering voice is correct based on the answering voice input of the guided rhetorical question data. The invention adopts heuristic voice interaction method to inspire and guide children to think, and remedies the defect that the interaction between intelligent devices and users in the prior art can not guide and educate the thinking mode.

【技术实现步骤摘要】
启发式语音交互方法及装置
本专利技术涉及人机交互
,具体涉及一种启发式语音交互方法及装置。
技术介绍
人机交互是一门研究系统与用户之间关系的科学,其中系统可以是各种各样的机器,也可以是计算机化的系统或软件。通过人机交互可以实现智能客户系统、语音控制等各种人工智能系统。在现有儿童智能产品中,用户向设备提问问题,设备就会做出相应的回答,但从中缺少了儿童在成长中教育角色对儿童思考的启发引导环节,智能设备与用户交互无法对思维方式进行引导教育。
技术实现思路
本专利技术提供一种启发式语音交互方法及装置,采用启发式语音交互方法启发引导儿童思考,弥补现有技术中智能设备与用户交互无法对思维方式进行引导教育的缺陷。一种启发式语音交互方法,包括:获取用户输入的提问请求,所述提问请求包括提问语音和用户标识;根据所述提问语音进行声纹识别,确定所述用户的用户年龄段;并根据所述提问语音进行语音识别,确定识别后的提问语音数据;对所述提问语音数据进行自然语言理解处理,并根据自然语言理解的处理结果判断所述提问语音数据是否属于问答知识类;当所述提问语音数据属于问答知识类时,根据知识问答图谱获取与所述提问语音数据相对应的答案数据;根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数,当所述输入次数不小于预设阈值时,将所述答案数据反馈至用户;当所述输入次数小于预设阈值时,判断所述用户的用户年龄段与所述提问语音数据的难易属性是否相匹配;当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时,根据所述提问语音数据生成相对应的引导式反问数据;接收用户基于所述引导式反问数据输入的回答语音,并判断所述回答语音是否正确,当所述回答语音正确时,将所述答案数据反馈至用户。优选的,所述根据所述提问语音数据生成相对应的引导式反问数据包括:根据所述提问语音数据的自然语言理解的处理结果进行简单化处理,提取所述提问语音数据的特征信息,并根据所述特征信息生产对应的简单问句;当用户基于所述简单问句输入的回答语音正确时,根据所述特征信息生成难易程度更大的简单问句,直至所述简单问句为与所述提问语音数据完全对应的问句。优选的,所述判断所述回答语音是否正确包括:根据语音识别算法对所述回答语音进行识别处理,生成对应的回答文本信息;对所述回答文本信息进行分句处理,获取相应的用户语句;计算所述用户语句与所述正确答案的相似度,并判断所述相似度是否超过相似度阙值;若在所述相似度超过相似度阙值,则所述回答语音正确;若所述相似度未超过相似度阙值,则所述回答语音错误。优选的,所述计算所述用户语句与所述正确答案的相似度包括:分别对所述用户语句和所述正确答案进行分词处理,获取对应的关键词集;根据所述用户语句和所述正确答案的关键词集,计算所述用户语句与所述正确答案的相似度。在一个实施例中,当所述输入次数小于预设阈值时,在所述将所述答案数据反馈至用户之后,还包括:根据所述用户的输入次数和所述回答语音对所述用户进行评分,并生成相对应的评分信息;将所述评分信息转换为语音形式的评分信息,并播放所述语音形式的评分信息。本专利技术实施例提供一种启发式语音交互装置,包括:获取请求模块,用于获取用户输入的提问请求,所述提问请求包括提问语音和用户标识;识别模块,用于根据所述提问语音进行声纹识别,确定所述用户的用户年龄段;并根据所述提问语音进行语音识别,确定识别后的提问语音数据;处理模块,用于对所述提问语音数据进行自然语言理解处理,并根据自然语言理解的处理结果判断所述提问语音数据是否属于问答知识类;获取答案模块,用于当所述提问语音数据属于问答知识类时,根据知识问答图谱获取与所述提问语音数据相对应的答案数据;第一判断模块,用于根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数,当所述输入次数不小于预设阈值时,将所述答案数据反馈至用户;第二判断模块,用于当所述输入次数小于预设阈值时,判断所述用户的用户年龄段与所述提问语音数据的难易属性是否相匹配;引导模块,用于当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时,根据所述提问语音数据生成相对应的引导式反问数据;反馈模块,用于接收用户基于所述引导式反问数据输入的回答语音,并判断所述回答语音是否正确,当所述回答语音正确时,将所述答案数据反馈至用户。优选的,所述引导模块包括:简单化处理单元,用于根据所述提问语音数据的自然语言理解的处理结果进行简单化处理,提取所述提问语音数据的特征信息,并根据所述特征信息生产对应的简单问句;循环处理单元,用于当用户基于所述简单问句输入的回答语音正确时,根据所述特征信息生成难易程度更大的简单问句,直至所述简单问句为与所述提问语音数据完全对应的问句。优选的,所述反馈模块包括:语音识别单元,用于根据语音识别算法对所述回答语音进行识别处理,生成对应的回答文本信息;分句单元,用于对所述回答文本信息进行分句处理,获取相应的用户语句;计算单元,用于计算所述用户语句与所述正确答案的相似度,并判断所述相似度是否超过相似度阙值;处理单元,用于若在所述相似度超过相似度阙值,则所述回答语音正确;若所述相似度未超过相似度阙值,则所述回答语音错误。优选的,所述计算单元包括:分词子单元,用于分别对所述用户语句和所述正确答案进行分词处理,获取对应的关键词集;计算子单元,用于根据所述用户语句和所述正确答案的关键词集,计算所述用户语句与所述正确答案的相似度。在一个实施例中,所述的启发式语音交互装置,还包括评分模块和播放模块;当所述输入次数小于预设阈值时,在所述反馈模块将所述答案数据反馈至用户之后,所述评分模块用于根据所述用户的输入次数和所述回答语音对所述用户进行评分,并生成相对应的评分信息;所述播放模块用于将所述评分信息转换为语音形式的评分信息,并播放所述语音形式的评分信息。一种启发式语音交互方法及装置,通过对用户输入的提问请求进行声纹识别,确定用户的年龄段,并通过语音识别确定识别后的提问语音数据,同时对提问语音数据进行自然语言理解处理,判断提问语音数据所属类型,利用用户标识判断用户提问的次数,在用户第一次提问这类问题时,由系统引导用户给出一个自身思考的答案,并随后播报正确答案。通过这样的方式,在交互中引入一个启发思考的环节。加强儿童产品中,儿童对一个问题的思考,提升儿童思维能力。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1为本专利技术实施例中启发式语音交互方法流程图;图2为本专利技术实施例中启发式语音交互装置结构图。具体实施方式下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例参见图1,本专利技术实施例提供一种启发式语音交互方本文档来自技高网...
启发式语音交互方法及装置

【技术保护点】
1.一种启发式语音交互方法,其特征在于,包括:获取用户输入的提问请求,所述提问请求包括提问语音和用户标识;根据所述提问语音进行声纹识别,确定所述用户的用户年龄段;并根据所述提问语音进行语音识别,确定识别后的提问语音数据;对所述提问语音数据进行自然语言理解处理,并根据自然语言理解的处理结果判断所述提问语音数据是否属于问答知识类;当所述提问语音数据属于问答知识类时,根据知识问答图谱获取与所述提问语音数据相对应的答案数据;根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数,当所述输入次数不小于预设阈值时,将所述答案数据反馈至用户;当所述输入次数小于预设阈值时,判断所述用户的用户年龄段与所述提问语音数据的难易属性是否相匹配;当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时,根据所述提问语音数据生成相对应的引导式反问数据;接收用户基于所述引导式反问数据输入的回答语音,并判断所述回答语音是否正确,当所述回答语音正确时,将所述答案数据反馈至用户。

【技术特征摘要】
1.一种启发式语音交互方法,其特征在于,包括:获取用户输入的提问请求,所述提问请求包括提问语音和用户标识;根据所述提问语音进行声纹识别,确定所述用户的用户年龄段;并根据所述提问语音进行语音识别,确定识别后的提问语音数据;对所述提问语音数据进行自然语言理解处理,并根据自然语言理解的处理结果判断所述提问语音数据是否属于问答知识类;当所述提问语音数据属于问答知识类时,根据知识问答图谱获取与所述提问语音数据相对应的答案数据;根据所述用户标识判断所述用户输入相同的所述提问语音的输入次数,当所述输入次数不小于预设阈值时,将所述答案数据反馈至用户;当所述输入次数小于预设阈值时,判断所述用户的用户年龄段与所述提问语音数据的难易属性是否相匹配;当所述用户的用户年龄段与所述提问语音数据的难易属性相匹配时,根据所述提问语音数据生成相对应的引导式反问数据;接收用户基于所述引导式反问数据输入的回答语音,并判断所述回答语音是否正确,当所述回答语音正确时,将所述答案数据反馈至用户。2.如权利要求1所述的启发式语音交互方法,其特征在于,所述根据所述提问语音数据生成相对应的引导式反问数据包括:根据所述提问语音数据的自然语言理解的处理结果进行简单化处理,提取所述提问语音数据的特征信息,并根据所述特征信息生产对应的简单问句;当用户基于所述简单问句输入的回答语音正确时,根据所述特征信息生成难易程度更大的简单问句,直至所述简单问句为与所述提问语音数据完全对应的问句。3.如权利要求1所述的启发式语音交互方法,其特征在于,所述判断所述回答语音是否正确包括:根据语音识别算法对所述回答语音进行识别处理,生成对应的回答文本信息;对所述回答文本信息进行分句处理,获取相应的用户语句;计算所述用户语句与所述正确答案的相似度,并判断所述相似度是否超过相似度阙值;若在所述相似度超过相似度阙值,则所述回答语音正确;若所述相似度未超过相似度阙值,则所述回答语音错误。4.如权利要求3所述的启发式语音交互方法,其特征在于,所述计算所述用户语句与所述正确答案的相似度包括:分别对所述用户语句和所述正确答案进行分词处理,获取对应的关键词集;根据所述用户语句和所述正确答案的关键词集,计算所述用户语句与所述正确答案的相似度。5.如权利要求1所述的启发式语音交互方法,其特征在于,当所述输入次数小于预设阈值时,在所述将所述答案数据反馈至用户之后,还包括:根据所述用户的输入次数和所述回答语音对所述用户进行评分,并生成相对应的评分信息;将所述评分信息转换为语音形式的评分信息,并播放所述语音形式的评分信息。6.一种启发式语音交互装置,其特征在于,包括:获取请求模块,用于获取用户输入的提问请求,所述提问请求包括提问语音和用...

【专利技术属性】
技术研发人员:周海
申请(专利权)人:北京云知声信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1