一种智能语音交互方法、装置、出行终端、设备及介质制造方法及图纸

技术编号:23402008 阅读:21 留言:0更新日期:2020-02-22 14:04
本发明专利技术涉及一种智能语音交互方法、装置、出行终端、设备及存储介质,其中,该智能语音交互方法,包括:采集第一预定时间段内的声音;将所述声音识别转换成语音文本;在语料库中匹配找出与之匹配的回答结果;输出回答结果。本发明专利技术实施例与现有技术相比,通过在录音或语音转换过程中,消除不必要的静音部分,降低数据处理的负担,同语音转换可以可有效降低环境噪音带来的干扰,有效提升语音识别效果;在匹配回答结果时优先剔除容易对匹配结果造成误扰的词语,提升了回答结果的准确度,使得应用更为广泛。

An intelligent voice interaction method, device, travel terminal, device and medium

【技术实现步骤摘要】
一种智能语音交互方法、装置、出行终端、设备及介质
本专利技术涉及语音识别
,具体涉及一种智能语音交互方法、装置、出行终端、设备及介质。
技术介绍
本部分向读者介绍可能与专利技术实施例的各个方面相关的
技术介绍
,相信能够向读者提供有用的背景信息,从而有助于读者更好地理解本专利技术实施例的各个方面。因此,可以理解,本部分的说明是用于上述目的,而并非构成对现有技术的承认。语音技术已经由一门很年轻的计算机技术发展成了一门非常流行、也越来越成熟的技术。未来的计算机的发展趋势是人工智能,让计算机能听、能说,是未来人机交互的重要发展方向,其中语音成为未来最被看好的人机交互方式,而且语音比其他的交互方式有更多的优势。随着人工智能技术的不断进步,人机语音交互也取得了长足的发展,各种语音助手和人机交互设备受到越来越多的用户的青睐。随着语音识别技术的快速发展,人机交互技术也逐步提升,这使得语音交互的应用领域越来越广泛。智能聊天、服务机器人慢慢进入人们的生活,例如智能音箱、银行智能服务机器人,餐厅智能语音点餐机、语音导航系统等等。一般而言,功能细化的语音交互系统可以取得更好的效果,所以没有一套系统可以应用于各种领域,比如银行的服务机器人不会有丰富的聊天技能,餐厅的点餐机器人也不了解银行的业务。因此,本专利技术实现的智能聊天服务系统主要应用于闲聊、娱乐,通过搜集问题的反馈方式,不断优化回答问题的质量。此外,由于国内的语音交互系统面向的用户群体主要是国内用户,所以大多不同时兼备和中文交互本领相持衡的中英文混合功能。但是在应用于机场、景点等地区的智能机器人而言,同时进行中英文识别且无需刻意切换模式显得尤为重要。另外一个创新点是当前聊天机器人存在一个问题就是答非所问,即无法根据问题匹配正确的答案,
技术实现思路
要解决的技术问题是如何提供一种智能语音交互方法、装置、出行终端、设备及介质。针对现有技术中的缺陷,本专利技术提供一种智能语音交互方法、装置、出行终端、设备及介质,有效提升语音识别效果,提升了回答结果的准确度。第一方面,本专利技术提供了一种智能语音交互方法,包括:采集第一预定时间段内的声音;将所述声音识别转换成语音文本;在语料库中匹配找出与之匹配的回答结果;输出回答结果。可选地,所述采集第一预定时间段内的声音包括:按预定数量的采样点计算第二预定时间段内的能量;根据所述能量确定当前音频信号是语音/噪音还是静音;根据静音持续的时间结束录音。可选地,所述第二预定时间为0.1s。可选地,所述静音持续的时间为0.5s。可选地,所述第一预定时间为1.5s。可选地,所述在语料库中匹配找出与之匹配的回答结果,包括:通过将识别出来的非中文问题翻译成待匹配中文文本问题;将所述待匹配中文文本问题匹配对应的中文问题;将匹配后的中文问题转换成匹配的中文回答;将中文回答转换成非中文回答。可选地,所述将所述待匹配中文文本问题匹配对应的中文问题包括:计算待匹配文本的向量和语料库文体文本向量;计算匹配文本向量与语料库文体文本向量的余弦相似度;选择余弦相似度最高的多个匹配结果按照关键词权重再次匹配得到权重匹配结果;重新对权重匹配结果进行余弦相似度的计算,选出余弦相似度最高的作为最终匹配结果。可选地,所述计算匹配文本向量与语料库文体文本向量的余弦相似度是按照下式计算的:其中,cos(v1,v2i)表示余弦相似度v1j表示输入文本的向量;i表示和j表示第i句话第j个字。可选地,所述权重是按照下式计算的:其中,αk表示赋予的权重值,k表示词频率排名,k越大,词频率越低,权重越高。可选地,所述权重值是按照词频计算得到的,词频是按照下式计算的:其中,ρ表示词的出现频率,k的取值是0或1,某个词在某句话中出现的话k为1,否则为0,n是语料库问题总数。第二方面,本专利技术实施例还提供一种智能语音交互装置,包括:语音采集单元,用于采集第一预定时间段内的声音;语音转换单元,用于将所述声音识别转换成文本;答案匹配单元,用于在语料库中匹配找出与之匹配的回答结果;语音输出单元,用于输出回答结果。可选地,所述语音采集单元包括:语音采样模块,用于按预定数量的采样点计算第二预定时间段内的能量静音识别模块,用于根据所述能量确定当前音频信号是语音/噪音还是静音;录音控制单元,用于根据静音持续的时间结束录音。可选地,所述第二预定时间为0.1s。可选地,所述第一预定时间为1.5s。可选地,所述答案匹配单元包括:翻译模块,用于将识别出来的非中文问题翻译成待匹配中文文本问题;问题匹配模块,用于将所述待匹配中文文本问题匹配对应的中文问题;答案匹配模块,用于将匹配后的中文问题转换成匹配的中文回答;答案转换模块,将中文回答转换成非中文回答。可选地,所述问题匹配模块包括:向量计算模块,用于计算待匹配文本的向量和语料库文体文本向量;相似度计算模块,用于计算匹配文本向量与语料库文体文本向量的余弦相似度;权重匹配单元,用于选择余弦相似度最高的多个匹配结果按照关键词权重再次匹配得到权重匹配结果;二次匹配单元,用于重新对权重匹配结果进行余弦相似度的计算,选出余弦相似度最高的作为最终匹配结果。第三方面,本专利技术实施例还提供一种语音出行装置,其特征在于,所述装置包括上述的智能语音交互装置。第四方面,本专利技术实施例还提供一种电子设备,其特征在于,所述电子设备包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述的智能语音交互方法。第五方面,本专利技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述的一种智能语音交互方法。由上述技术方案可知,本专利技术实施例提供的一种智能语音交互方法、装置、出行终端、设备及介质,与现有技术相比,通过在录音或语音转换过程中,消除不必要的静音部分,降低数据处理的负担,同语音转换可以可有效降低环境噪音带来的干扰,有效提升语音识别效果;在匹配回答结果时优先剔除容易对匹配结果造成误扰的词语,提升了回答结果的准确度,使得应用更为广泛。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单的介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一个实施例中智能语音交互方法流程示意图;图2为图1所示的实施例中采集第一预定时间段内的声音流程示意图;图3为图1所示的实施例中在语本文档来自技高网
...

【技术保护点】
1.一种智能语音交互方法,其特征在于:包括:/n采集第一预定时间段内的声音;/n将所述声音识别转换成语音文本;/n在语料库中匹配找出与之匹配的回答结果;/n输出回答结果。/n

【技术特征摘要】
20191206 CN 20191124287091.一种智能语音交互方法,其特征在于:包括:
采集第一预定时间段内的声音;
将所述声音识别转换成语音文本;
在语料库中匹配找出与之匹配的回答结果;
输出回答结果。


2.根据权利要求1所述的智能语音交互方法,其特征在于,所述采集第一预定时间段内的声音包括:
按预定数量的采样点计算第二预定时间段内的能量;
根据所述能量确定当前音频信号是语音/噪音还是静音;
根据静音持续的时间结束录音。


3.根据权利要求1所述的智能语音交互方法,其特征在于,所述在语料库中匹配找出与之匹配的回答结果,包括:
通过将识别出来的非中文问题翻译成待匹配中文文本问题;
将所述待匹配中文文本问题匹配对应的中文问题;
将匹配后的中文问题转换成匹配的中文回答;
将中文回答转换成非中回答。


4.根据权利要求3所述的智能语音交互方法,其特征在于,所述将所述待匹配中文文本问题匹配对应的中文问题包括:
计算待匹配文本的向量和语料库文体文本向量;
计算匹配文本向量与语料库文体文本向量的余弦相似度;
选择余弦相似度最高的多个匹配结果按照关键词权重再次匹配得到权重匹配结果;
重新对权重匹配结果进行余弦相似度的计算,选出余弦相似度最高的作为最终匹配结果。


5.一种智能语音交互装置,其特征在于:包括:
语音采集单元...

【专利技术属性】
技术研发人员:陈章芳
申请(专利权)人:广州易来特自动驾驶科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1