机器人与网络服务器协作处理的语音识别方法、装置制造方法及图纸

技术编号:15865526 阅读:36 留言:0更新日期:2017-07-23 13:14
本发明专利技术提供一种机器人与网络服务器协作处理的语音识别方法及装置,所述方法包括步骤:通过所述机器人上的麦克风获取用户的目标语音信号;对所述目标语音信号进行处理,以获取所述目标语音信号的第一语音可信度值;从所述目标语音信号提取目标背景噪声;根据所述第一语音可信度值,获取与所述目标背景噪声对应的第二语音可信度值;于所述第二语音可信度值不小于可信度阈值时,所述机器人根据所述目标语音信号运行相应的功能。本发明专利技术只要在保证网络畅通的前提下,通过强大的后台服务器来提取特征,在保证识别率的前提下使得机器人省去了这一处理过程,从而节约了相应的成本。

【技术实现步骤摘要】
机器人与网络服务器协作处理的语音识别方法、装置
本专利技术涉及语音处理
,尤其涉及一种机器人与网络服务器协作处理的语音识别方法、装置。
技术介绍
在现有技术中,通过语音识别技术就能够让机器人识别和理解用户的语音命令,并根据这些语音命令执行相应的动作。所以,语音识别技术作为人机交互的手段,成为智能机器人中重要的技术手段之一。但是,就目前而言,高识别率意味着机器人的硬件成本较高,所以如何在降低成本的同时实现较高的识别效率,成为目前亟待解决的问题。
技术实现思路
鉴于上述问题,本申请记载了一种机器人与网络服务器协作处理的语音识别方法,所述方法包括步骤:A100:通过所述机器人上的麦克风获取用户的目标语音信号;A101:对所述目标语音信号进行处理,以获取所述目标语音信号的第一语音可信度值;A102:从所述目标语音信号中提取目标背景噪声;A103:根据所述第一语音可信度值,获取与所述目标背景噪声对应的第二语音可信度值;A105:于所述第二语音可信度值不小于可信度阈值时,所述机器人根据所述目标语音信号运行相应的功能;其中,所述机器人根据所述目标语音信号运行相应的功能的过程包括步骤:A1501:机器人将所述目标语音信号传递至所述网络服务器中;A1502:所述网络服务器对所述目标语音信号进行特征提取,生成用户语音特征包,并将所述用户语音特征包下载至机器人中;A1503:根据所述机器人中的机器人识别数据库对所述用户语音特征包进行识别以获取识别结果;A1504:所述机器人根据所述识别结果运行相应的功能。。较佳的,从所述目标语音信号提取目标背景噪声并获取所述目标背景噪声的噪声种类的过程包括步骤:A1021:获取所述目标语音信号中的噪声的梅尔频率倒谱系数;A1022:根据所述梅尔频率倒谱系数和所述噪声分类数据库,获取所述目标语音信号的噪声种类。较佳的,建立所述噪声分类数据库的过程包括步骤:A201:获取不同噪声种类下多个噪声信号;A202:获取所有的所述噪声信号的梅尔频率倒谱系数;A203:根据EM算法对所有的所述梅尔频率倒谱系数进行处理,建立所述噪声分类数据库。较佳的,根据目标语音信号获取目标背景噪声中噪声音量的过程包括步骤:A1023:提取所述目标语音信号的特征信息;A1024:根据所述特征信息,进行语音激活检测;A1025:获取所述噪声音量。较佳的,所述方法还包括:A106:于所述第二语音可信度值小于所述可信度阈值时,则提示用户重新输入并不再对所述目标语音信号进行处理。本专利技术还提供了一种机器人与网络服务器协作处理的语音识别装置,所述装置适用于上述提出的机器人与网络服务器协作处理的语音识别方法。上述技术方案具有如下优点或有益效果:本专利技术技术方案提供了一种机器人与网络服务器协作处理的语音识别方法,通过获取目标背景噪声,并根据预先存储的可信度调整系数和所述目标背景噪声,获取第二语音可信度值。这种根据目标背景噪声,灵活调整可信度值的方法,大大提升了噪声背景下的语音识别率。另外,只要在保证网络畅通的前提下,通过强大的后台服务器来提取特征,在保证识别率的前提下使得机器人省去了这一处理过程,从而节约了相应的成本。附图说明参考所附附图,以更加充分的描述本专利技术的实施例。然而,所附附图仅用于说明和阐述,并不构成对本专利技术范围的限制。图1为本专利技术实施例一提供的一种机器人与网络服务器协作处理的语音识别方法流程图;图2为本专利技术实施例二提供的一种机器人与网络服务器协作处理的语音识别方法的另一种实现方式的流程图;图3为本专利技术实施例二中噪声分类数据库建立的流程图;图4为本专利技术实施例三提供的一种机器人与网络服务器协作处理的语音识别方法的另一种实现方式的流程图;图5为本专利技术实施例四提供的一种机器人与网络服务器协作处理的语音识别方法的另一种实现方式的流程图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获取的所有其他实施例,都属于本专利技术实施例保护的范围。在本专利技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本专利技术。在本专利技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。进一步应当理解,本文中采用的术语“包括”规定了所述的特征、整体、步骤、操作、元件和/或部件的存在,而不排除一个或多个其他特征、整体、步骤、操作、元件、部件和/或它们的组的存在或附加。实施例一图1为本专利技术实施例一提供的一种机器人与网络服务器协作处理的语音识别方法的流程图。如图1所示,本专利技术实施例一提供一种机器人与网络服务器协作处理的语音识别方法具体可以包括步骤:A100,通过所述机器人上的麦克风获取用户的目标语音信号;用户发出目标语音信号时,机器人底座上的麦克风实时获取该目标语音信号。A101,根据所述目标语音信号,获取第一语音可信度值。该第一语音可信度值是指对该目标语音信号进行识别处理后,识别处理结果的可信程度。具体来讲,当用户输入的目标语音信号为“打开卧室的空调”,则在对该目标语音信号识别过程中,返回的第一语音可信度值包含:总可信度值X1(“打开卧室的空调”的总体可信度值),动作命令可信度值X2(“打开”为动作命令词,即“打开”的可信度值为X2),地点可信度值X3(“卧室”为地点,即“卧室”的可信度值为X3),对象可信度X(“空调”为后置命令词,即“空调”的可信度为X4)。在具体计算中,总可信度X1是由X2、X3、X4综合得到的。应当理解,尽管在本专利技术实施例中可能采用术语第一、第二等来描述各种可信度值,但这些可信度值不应限于这些术语。这些术语仅用来将可信度值彼此区分开。例如,在不脱离本专利技术实施例范围的情况下,第一语音可信度值也可以被称为第二语音可信度值,类似地,第二语音可信度值也可以被称为第一语音可信度值。并且该第一语音可信度值和第二语音可信度值都是可信度值。A102,从所述目标语音信号提取目标背景噪声;根据麦克风接收到的目标语音信号,获取目标背景噪声。所述目标背景噪声是用户输入目标语音信号时所处的噪声状态。具体到实际应用中,因为家用机器人通常在的使用环境较单一,但是如果当用户在发出目标语音信号时,电视机等家用电器的使用或其它的人声均会产生噪声背景,即此时所指的目标背景噪声是指用户在噪声背景下输入该目标语音信号。值得指出的是,所述步骤A102可以在步骤A101之前,所述步骤A102也可以在步骤A101之后,或者所述步骤A102可以和步骤A101同时执行,本专利技术实施例对此不做限制。A103,根据所述第一语音可信度值,获取与所述目标背景噪声对应的第二语音可信度值。该第二语音可信度值是根据获取的第一语音可信度值获取的。第二语音可信度值并不是根据麦克风接收到的目标语音信号直接计算获得到的,而是根据该第一语音可信度值间接获取。在获取该目标语音信号所处的目标背景噪声之后,可以根本文档来自技高网...
机器人与网络服务器协作处理的语音识别方法、装置

【技术保护点】
一种机器人与网络服务器协作处理的语音识别方法,其特征在于,所述方法包括步骤:A100:通过所述机器人上的麦克风获取用户的目标语音信号;A101:对所述目标语音信号进行处理,以获取所述目标语音信号的第一语音可信度值;A102:从所述目标语音信号中提取目标背景噪声;A103:根据所述第一语音可信度值,获取与所述目标背景噪声对应的第二语音可信度值;A105:于所述第二语音可信度值不小于可信度阈值时,所述机器人根据所述目标语音信号运行相应的功能;其中,所述机器人根据所述目标语音信号运行相应的功能的过程包括步骤:A1501:机器人将所述目标语音信号传递至所述网络服务器中;A1502:所述网络服务器对所述目标语音信号进行特征提取,生成用户语音特征包,并将所述用户语音特征包下载至机器人中;A1503:根据所述机器人中的机器人识别数据库对所述用户语音特征包进行识别以获取识别结果;A1504:所述机器人根据所述识别结果运行相应的功能。

【技术特征摘要】
1.一种机器人与网络服务器协作处理的语音识别方法,其特征在于,所述方法包括步骤:A100:通过所述机器人上的麦克风获取用户的目标语音信号;A101:对所述目标语音信号进行处理,以获取所述目标语音信号的第一语音可信度值;A102:从所述目标语音信号中提取目标背景噪声;A103:根据所述第一语音可信度值,获取与所述目标背景噪声对应的第二语音可信度值;A105:于所述第二语音可信度值不小于可信度阈值时,所述机器人根据所述目标语音信号运行相应的功能;其中,所述机器人根据所述目标语音信号运行相应的功能的过程包括步骤:A1501:机器人将所述目标语音信号传递至所述网络服务器中;A1502:所述网络服务器对所述目标语音信号进行特征提取,生成用户语音特征包,并将所述用户语音特征包下载至机器人中;A1503:根据所述机器人中的机器人识别数据库对所述用户语音特征包进行识别以获取识别结果;A1504:所述机器人根据所述识别结果运行相应的功能。2.根据权利要求1所述的机器人与网络服务器协作处理的语音识别方法,其特征在于,从所述目标语音信号提取目标背景噪声并获取所述目标背景噪声的噪声种类的过程包括步骤:A1021:获取所述目标语音信号中的噪声的梅尔频率倒谱系数;A1022:根据所述梅尔频率倒谱...

【专利技术属性】
技术研发人员:祝铭明
申请(专利权)人:芋头科技杭州有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1