一种语音识别方法和客户端技术

技术编号:9144068 阅读:137 留言:0更新日期:2013-09-12 05:32
本发明专利技术提供了一种语音识别方法,该方法包括:客户端判断当前的语音识别应用是否涉及隐私,如果是,则由客户端对采集到的语音信号进行语音识别;否则,进一步判断与服务器是否成功建立连接,如果成功建立连接,由服务器对采集到的语音信号进行语音识别;如果不成功建立连接,由客户端对采集到的语音信号进行语音识别。本发明专利技术同时公开了一种语音识别中的客户端,应用本发明专利技术所述的语音识别方法和客户端,能够实现对包含隐私的语音数据进行语音识别,且不受网络条件是否支持的限制。

【技术实现步骤摘要】
一种语音识别方法和客户端
本专利技术涉及语音识别
,特别涉及一种语音识别方法和客户端。
技术介绍
图1为现有语音识别方法的工作流程图,如图1所示,该流程包括:步骤101:服务器与客户端建立连接后,接收由客户端发送的语音信号。步骤102:服务器接收到语音信号后,提取语音信号中的语音识别特征,根据语音识别模型对语音识别特征进行语音识别。步骤103:服务器将语音识别后得到的识别结果返回给客户端。至此,即完成了现有语音识别方法的整个工作流程。通过上述分析可以看出,首先,由于现有语音识别在服务器端进行,当用户不愿将包含隐私的语音数据上传到服务器时,也就无法完成这类语音数据的语音识别;其次,现有的语音识别方法是在服务器端进行的,使得语音识别受到网络条件的限制,当网络条件不支持时,也就无法完成语音识别;最后,现有语音识别方法没有针对用户和环境进行自适应,因此,当用户存在多样性以及用户使用时环境多变性的情况下,服务器是无法提供可靠的语音识别服务的。
技术实现思路
有鉴于此,本专利技术提供了一种语音识别方法,能够对包含隐私的语音数据进行语音识别,且不受网络条件是否支持的限制。本专利技术还公开了一种语音识别中的客户端,能够对包含隐私的语音数据进行语音识别,且不受网络条件是否支持的限制。为了达到上述目的,本专利技术提出的技术方案为:一种语音识别方法,该方法包括:客户端判断当前的语音识别应用是否涉及隐私,如果是,则由客户端对采集到的语音信号进行语音识别;否则,由服务器对采集到的语音信号进行语音识别。当客户端判断出当前的语音识别应用不涉及隐私时,该方法进一步包括:判断与服务器是否成功建立连接,如果成功建立连接,由服务器对采集到的语音信号进行语音识别;否则,由客户端对采集到的语音信号进行语音识别。所述由客户端对采集到的语音信号进行语音识别包括:客户端提取所述语音信号中的语音识别特征,根据语音识别模型对提取到的语音识别特征进行语音识别;客户端根据语音识别后得到的识别结果对所述语音识别模型进行更新,得到更新后的语音识别模型;客户端根据更新后的语音识别模型对识别结果进行语音识别,得到更新的识别结果。该方法进一步包括:客户端重复执行根据更新的识别结果更新语音识别模型、根据更新的语音识别模型更新识别结果,直至更新后的自身语音识别模型相比更新前的自身语音识别模型的变化小于某个阈值。所述由服务器对采集到的语音信号进行语音识别包括:服务器提取语音信号中的语音识别特征,根据自身语音识别模型对语音识别特征进行语音识别;服务器根据得到的识别结果更新自身语音识别模型;根据更新的自身语音识别模型对识别结果进行语音识别,得到更新的识别结果;将所述更新的语音识别结果返回给客户端。该方法进一步包括:服务器重复执行根据更新的识别结果更新自身语音识别模型、根据更新的自身语音识别模型更新识别结果,直至更新后的自身语音识别模型相比更新前的自身语音识别模型的变化小于某个阈值。所述服务器提取语音信号中的语音识别特征之前,该方法进一步包括:服务器向客户端请求语音识别模型,并判断向客户端请求的语音识别模型的更新时间是否晚于自身语音识别模型更新时间,如果是,利用请求的客户端的语音识别模型更新自身语音识别模型;否则,将自身语音识别模型上传给客户端,以更新客户端中的语音识别模型。一种语音识别中的客户端,该客户端包括第一判断单元和语音识别单元,其中,所述第一判断单元,用于判断当前的语音识别应用是否涉及隐私;所述语音识别单元,用于当第一判断单元判断出当前的语音识别应用涉及隐私时,对采集到的语音信号进行语音识别。该客户端还包括第二判断单元,用于当第一判断单元判断出当前的语音识别应用不涉及隐私时,判断与服务器是否成功建立连接;则,所述语音识别单元,进一步用于当第二判断单元判断出与服务器没有成功建立连接时,对采集到的语音信号进行语音识别。所述语音识别单元包括第一识别子单元、更新子单元和第二识别子单元,其中,所述第一识别子单元,用于提取所述语音信号中的语音识别特征,根据语音识别模型对提取到的语音识别特征进行语音识别;所述更新子单元,用于根据第一识别子单元语音识别后得到的识别结果对所述语音识别模型进行更新,得到更新后的语音识别模型;所述第二识别子单元,用于根据所述更新子单元更新后的语音识别模型对识别结果进行语音识别,得到更新的识别结果。综上所述,本专利技术所采用的语音识别方法,是通过由客户端首先判断当前的语音识别应用是否涉及隐私,如果涉及隐私,则直接由客户端对所述采集到的语音信号进行语音识别,否则,才由服务器对所述采集到的语音信号进行语音识别。由于在本专利技术方法中,对涉及到隐私的语音数据是通过客户端来进行语音识别的,也就避免了上传服务器带来的语音信号的隐私外泄,因此,本专利技术方法能够完成对包含隐私的语音数据的语音识别处理。附图说明图1为现有语音识别方法的工作流程图;图2为本专利技术所采用的语音识别方法的工作流程图;图3为本专利技术语音识别中所采用的客户端的结构示意图。具体实施方式为了解决本专利技术提出的技术问题,本专利技术所述方案的具体实现包括:客户端判断当前的语音识别应用是否涉及隐私,如果是,则由客户端对采集到的语音信号进行语音识别;否则,由服务器对采集到的语音信号进行语音识别。为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本专利技术作进一步地详细描述。图2为本专利技术所采用的语音识别方法的工作流程图。如图2所示,该流程包括:步骤201:客户端判断当前的语音识别应用是否涉及隐私,如果是,执行步骤202;否则,执行步骤205。需要说明的是,在本步骤中,当前的语音识别应用是否涉及隐私是由客户端来决定的,如果客户端认为当前语音识别应用是需要保密的,则判断为当前语音识别应用为涉及隐私,否则,判断为不涉及隐私。步骤202:客户端提取语音信号中的语音识别特征,根据语音识别模型对提取到的语音识别特征进行语音识别。在该步骤中,针对不同语音信号中的语音识别特征,客户端可以采取不同的提取方式,具体可以为:对数字化语音信号进行高频预加重,按一定时间长度(如20毫秒)将语音信号分成若干帧,对分帧后的语音信号计算倒谱系数,最终每一帧语音信号都转换为若干维倒谱系数,即得到了了该数字化语音信号的语音识别特征。还可以采取其他提取方式,这里不再赘述。需要说明的是,在本步骤中,所述语音识别模型包括声学模型和语言模型,语音识别模块利用声学模型和语言模型计算输入语音信号所对应的最可能的词序列。语音识别系统通过动态规划的方法搜索语音信号对应的输出序列,利用声学模型在声学层搜索可能的音素序列,并计算各个序列的似然得分(likelihood),然后基于声学层结果利用语言模型在语言层搜索可能的词序列,并计算各个序列的似然得分(likelihood),最终输出得分最高的前N个序列(N≥1),即完成了语音识别过程。步骤203:客户端根据得到的识别结果对语音识别模型进行更新,得到更新后的语音识别模型。在本步骤中,所述客户端根据得到的识别结果对语音识别模型进行更新采用的是将最大似然线性回归(MaximumLikelihoodLinearRegression,MLLR)算法和本征音(Eigenvoice)算法相结合的方法,具体可以为:客户端保存用户的识别结果本文档来自技高网...

【技术保护点】
一种语音识别方法,其特征在于,该方法包括:客户端判断当前的语音识别应用是否涉及隐私,如果是,则由客户端对采集到的语音信号进行语音识别;否则,由服务器对采集到的语音信号进行语音识别。

【技术特征摘要】
1.一种语音识别方法,其特征在于,该方法包括:客户端判断当前的语音识别应用是否涉及隐私,如果是,则由客户端对采集到的语音信号进行语音识别,避免上传服务器带来的语音信号的隐私外泄;否则,由服务器对采集到的语音信号进行语音识别;所述由客户端对采集到的语音信号进行语音识别包括:客户端提取所述语音信号中的语音识别特征,根据语音识别模型对提取到的语音识别特征进行语音识别。2.根据权利要求1所述的方法,其特征在于,当客户端判断出当前的语音识别应用不涉及隐私时,该方法进一步包括:判断与服务器是否成功建立连接,如果成功建立连接,由服务器对采集到的语音信号进行语音识别;否则,由客户端对采集到的语音信号进行语音识别。3.根据权利要求1或2所述的方法,其特征在于,所述由客户端对采集到的语音信号进行语音识别还包括:客户端根据语音识别后得到的识别结果对所述语音识别模型进行更新,得到更新后的语音识别模型;客户端根据更新后的语音识别模型对识别结果进行语音识别,得到更新的识别结果。4.根据权利要求3所述的方法,其特征在于,该方法进一步包括:客户端重复执行根据更新的识别结果更新语音识别模型、根据更新的语音识别模型更新识别结果,直至更新后的自身语音识别模型相比更新前的自身语音识别模型的变化小于某个阈值。5.根据权利要求1或2所述的方法,其特征在于,所述由服务器对采集到的语音信号进行语音识别包括:服务器提取语音信号中的语音识别特征,根据自身语音识别模型对语音识别特征进行语音识别;服务器根据得到的识别结果更新自身语音识别模型;根据更新的自身语音识别模型对识别结果进行语音识别,得到更新的识别结果;将所述更新的语音识别结果返回给客户端。6.根据权利要求5所述的方法,其特征在于,所述服务器提取语音信号中的语音识别特征之前,该方法进一步包括:服务器向客户端请求语音识别模型,并判断向客户端请求的语音识别模型的更新时间是否晚于自身语音识别模型更新时间,如果是,利用请求的客户端的语音识别模型更新...

【专利技术属性】
技术研发人员:苏腾荣朱璇
申请(专利权)人:北京三星通信技术研究有限公司三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1