语音信息处理方法、播放设备及计算机可读存储介质技术

技术编号:20286776 阅读:17 留言:0更新日期:2019-02-10 18:39
本发明专利技术适用于语音识别技术领域,提供了语音信息处理方法、播放设备及计算机可读存储介质,所述语音信息处理方法包括:获取发出语音信息的用户与播放设备之间的距离;根据所述发出语音信息的用户与播放设备之间的距离,调整所述语音信息的声音响度,以使得所述语音信息的声音响度满足第一预设条件。通过本发明专利技术可减少对语音识别的干扰,提高语音识别的准确率。

Speech Information Processing Method, Player and Computer Readable Storage Media

The invention is applicable to the field of speech recognition technology, and provides voice information processing method, playback device and computer readable storage medium. The voice information processing method includes acquiring the distance between the user who sends voice information and the playback device, adjusting the voice loudness of the voice information according to the distance between the user who sends voice information and the playback device, and so on. The sound loudness of the voice information satisfies the first presupposition condition. The invention can reduce the interference to speech recognition and improve the accuracy of speech recognition.

【技术实现步骤摘要】
语音信息处理方法、播放设备及计算机可读存储介质
本专利技术属于语音识别
,尤其涉及语音信息处理方法、播放设备及计算机可读存储介质。
技术介绍
随着语音处理技术的发展,语音云服务的应用越来越广泛,例如苹果的siri,亚马逊的alexa。越来越多的播放设备(例如蓝牙音响)可以通过本地关键词语音识别或者按键触发蓝牙链路连接,然后通过蓝牙链路传输用户语音到手机上,再由手机通过互联网将语音传输到云服务上进行语音交互服务。然而,在现有技术中由于说话人与播放设备的距离不同,容易导致输入播放设备的语音有较大的差别,进而对播放设备的语音识别产生较大的干扰。
技术实现思路
有鉴于此,本专利技术实施例提供了语音处理方法、播放设备及计算机可读存储介质,以减少对语音识别的干扰,提高语音识别的准确率。本专利技术实施例的第一方面提供了一种语音信息处理方法,所述语音信息处理方法包括:获取发出语音信息的用户与播放设备之间的距离;根据所述发出语音信息的用户与播放设备之间的距离,调整所述语音信息的声音响度,以使得所述语音信息的声音响度满足第一预设条件。本专利技术实施例的第二方面提供了一种播放设备,所述播放设备包括:距离获取模块,用于获取发出语音信息的用户与播放设备之间的距离;调整模块,用于根据所述发出语音信息的用户与播放设备之间的距离,调整所述语音信息的声音响度,以使得所述语音信息的声音响度满足第一预设条件。本专利技术实施例的第三方面提供了一种播放设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述语音信息处理方法的步骤。本专利技术实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述语音信息处理方法的步骤。本专利技术实施例与现有技术相比存在的有益效果是:本专利技术实施例通过获取发出语音信息的用户与播放设备之间的距离,并根据所述发出语音信息的用户与播放设备之间的距离,调整所述语音信息的声音响度,从而使得所述播放设备所接收到的所述语音信息的声音响度满足第一预设条件(例如,将语音信息的语音响度调整至最佳的响度),减少输入播放设备的语音信息的差别,进而减少对语音识别的干扰,提高语音识别的准确率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例一提供的语音信息处理方法的实现流程图;图2是本专利技术实施例一提供的平面四元T形阵列结构图;图3是本专利技术实施例二提供的语音信息处理方法的实现流程图;图4是本专利技术实施例三提供的播放设备的示意图;图5是本专利技术实施例四提供的播放设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。参见图1,是本专利技术实施例一提供的语音信息处理方法的实现流程图,该语音信息处理方法应用于播放设备,如图所示该语音信息处理方法可以包括以下步骤:步骤S101,获取发出语音信息的用户与播放设备之间的距离。在本专利技术实施例例中,播放设备在接收到语音信息时,获取发出所述语音信息的用户(即声源)相对于所述播放设备的位置信息,例如,发出所述语音信息的用户与播放设备之间的距离、角度等。可选的,所述获取发出语音信息的用户与播放设备之间的距离包括:根据所述播放设备中的麦克风阵列对发出语音信息的用户进行定位,以获取所述发出语音信息的用户与播放设备之间的距离。在本专利技术实施例中,可以通过所述播放设备中的麦克风阵列对发出语音信息的用户进行定位,从而获取发出语音信息的用户与播放设备之间的位置信息。其中,所述麦克风阵列包括多个麦克风。优选的,所述麦克风阵列包括四个麦克风。具体的,获取所述播放设备中麦克风阵列中每个麦克风的相对语音延迟时间,利用估计的延迟时间,计算发出语音信息的用户的位置。其中,延迟时间可以采用最小均方误差自适应滤波器方法进行估计。发出语音信息的用户与播放设备的位置信息可以基于延迟时间通过平面四元T形阵列几何定位算法来计算,计算如下:如图2所示是平面四元T形阵列结构图,由四个全向麦克风Mic0、Mic1、Mic2和Mic3组成。设定Mic0麦克风为参考麦克风,并以其所处位置为原点建立坐标系,其余三个麦克风与参考麦克风的距离均为L。设声源(发出语音信息的用户)入射波到达麦克风Mic1、Mic2和Mic3相对于到达参考麦克风Mic0的时间延迟分别为τ10、τ20和τ30。声源的方位角为ψ,定义为声源入射方向在xoy平面的投影与x轴正向的夹角。声源的仰角为θ,定义为声源入射方向与其在xoy平面的投影的夹角。声源距参考麦克风的距离记为R,空气声速为c。由声源和麦克风阵列的几何位置关系,利用余弦定理可得:L2+2Rcτ10-(cτ10)2-2RLcosθcosψ=0(1)L2+2Rcτ20-(cτ20)2-2RLcosθsinψ=0(2)L2+2Rcτ30-(cτ30)2+2RLcosθcosψ=0(3)将公式(1)和公式(3)相加,可得:2L2+2Rc(τ10+τ30)-c2(τ102+τ302)=0(4)对公式(4)进行求解,可以获得声源与参考麦克风的距离R:由公式(3)减去公式(1),并整理可得:4RLcosθcosψ=2Rc(τ10-τ30)-c2(τ102-τ302)(6)整理公式(2)可得:2RLcosθsinψ=L2+2Rcτ20-(cτ20)2(7)由公式(6)和公式(7),两边分别对应相除,可得:因此声源方位角ψ为:令arctan(∞)=90°,arctan(-∞)=-90°,若目标位于远场,即有R>>cτi0,R>>L,i=1,2,3,则声源方位角ψ近似为:将公式(1)至公式(3)写成:Ad=b(11)其中,利用最小二乘法,可获得声源的仰角θ满足公式(13):即若声源处于远场,公式(13)可近似为:则声源仰角由上述分析可获得声源的位置信息的三个参数(R,ψ,θ)。公式(5)、(9)和(14)为近场情况下平面四元T形阵列的几何定位方程。若声源处于远场,则公式(9)和(14)相应地简化为公式(10)和(16)。根据上述定位方程,即可通过相应的时延差计算出声源相对麦克风阵列的几何位置。由公式(9)和(10)可知,当tanψ>0时,声源的方位角可能是在[0°,90°]或[180°,270°];当tanψ<0时,声源的方位角可能是区间[90°,180°][或[270°,360°]。因此,为了唯一确定声源的方位角,在实际应用中可将麦克风阵列靠近房间的墙壁(即播放设备靠墙壁放置),本文档来自技高网...

【技术保护点】
1.一种语音信息处理方法,其特征在于,所述语音信息处理方法包括:获取发出语音信息的用户与播放设备之间的距离;根据所述发出语音信息的用户与播放设备之间的距离,调整所述语音信息的声音响度,以使得所述语音信息的声音响度满足第一预设条件。

【技术特征摘要】
1.一种语音信息处理方法,其特征在于,所述语音信息处理方法包括:获取发出语音信息的用户与播放设备之间的距离;根据所述发出语音信息的用户与播放设备之间的距离,调整所述语音信息的声音响度,以使得所述语音信息的声音响度满足第一预设条件。2.如权利要求1所述的语音信息处理方法,其特征在于,所述获取发出语音信息的用户与播放设备之间的距离包括:根据所述播放设备中的麦克风阵列对发出语音信息的用户进行定位,以获取所述发出语音信息的用户与播放设备之间的距离。3.如权利要求1所述的语音信息处理方法,其特征在于,所述根据所述发出语音信息的用户与播放设备之间的距离,调整所述语音信息的声音响度包括:确定所述发出语音信息的用户与播放设备之间的距离所属的档位,其中,所述档位是指预先设置的距离范围;根据所述发出语音信息的用户与播放设备之间的距离所属的档位,调整所述语音信息的声音响度。4.如权利要求3所述的语音信息处理方法,其特征在于,所述根据所述发出语音信息的用户与播放设备之间的距离所属的档位,调整所述语音信息的声音响度包括:获取所述发出语音信息的用户与播放设备之间的距离所属的档位对应的声音响度的增益;根据所述发出语音信息的用户与播放设备之间的距离所属的档位对应的声音响度的增益,调整所述语音信息的声音响度。5.如权利要求1至4任一项所述的语音信息处理方法,其特征在于,所述语音信息处理方法还包括:获取所述发出语音信息的用户与播放设备之间的角度;判断所述发出语音信息的用户与播放设备之间的角度是否满足第二预设条件;若否,则转动所播放设备,以使得所述发出语音信息的用户与播放设备之间的角度满足第二预设条件。6.一种播放设备,其特征在于,所述播放设备包括:距离获取模块,用于获取发出语音信息的用户与播放设备之间的...

【专利技术属性】
技术研发人员:孙维国吴海全顾卫锋张恩勤王如军曹磊师瑞文
申请(专利权)人:深圳市冠旭电子股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1