语音识别方法、装置及服务器制造方法及图纸

技术编号:17972604 阅读:36 留言:0更新日期:2018-05-16 12:45
本发明专利技术提出了一种语音识别方法、装置及服务器。所述方法包括:接收客户端发送的用户语音;根据所述语音的声学特征,识别所述语音中的唤醒词对应的发音;将所述唤醒词的发音标注静音标识,使得在语音识别时跳过标有静音标识的唤醒词的发音。本发明专利技术实施例的技术方案对用户语音中的唤醒词标注为静音标识,以使得在语音识别时跳过标有静音标识的唤醒词的发音,这样在采用复杂的解码算法对语音进行识别时,避免对与用户指示无关的唤醒词进行识别,减小了解码算法的数据处理量,提高了语音识别的效率。

【技术实现步骤摘要】
语音识别方法、装置及服务器
本专利技术涉及语音识别
,尤其涉及一种语音识别方法、装置及服务器。
技术介绍
随着电子设备的不断发展,作为电子设备的重要组成部分-------电子设备的控制系统,例如,语音控制系统,也在不断地发展,随着语音识别技术迅速发展成熟,各种语音识别软件纷纷亮相,使得人与电子设备的交流变得简单、有趣。为了避免人与电子设备进行语音控制时产生误操作,可以设置唤醒词,当电子设备接收到与自身匹配的唤醒词时,才会接收外界的语音控制信息,并依据语音控制信息执行相应的操作。用户每次与电子设备进行语音交互时,电子设备接收到用户的语音,将用户的语音传送至服务端,由服务端来进行语音识别,然后按照用户的指示进行操作。但是,用户的语音中包含的信息较多,服务端在对用户语音进行识别时,需要对整段语音都进行识别,再筛选出与用户指示相关的有用信息,再执行用户的指示。这样使得语音识别的过程数据处理量较大,降低了语音识别的效率。
技术实现思路
本专利技术实施例提供一种语音识别方法、装置及服务器,以解决或缓解
技术介绍
中的一项或多项以上技术问题,至少提供一种有益的选择。第一方面,本专利技术实施例提供了一种语音识别方法,包括:接收客户端发送的用户语音;根据所述语音的声学特征,识别所述语音中的唤醒词对应的发音;将所述唤醒词的发音标注静音标识,使得在语音识别时跳过标有静音标识的唤醒词的发音。结合第一方面,本专利技术在第一方面的第一种实施方式中,根据所述语音的声学特征,识别所述语音中的唤醒词对应的发音,包括:将所述发音与识别路径中预先存储的唤配词匹配;若所述发音中存在一段语音与所述识别路径中预先存储的唤配词匹配,则将所述一段语音识别为唤醒词。结合第一方面,本专利技术在第一方面的第二实施方式中,将所述唤醒词的发音标注静音标识,使得在语音识别时跳过标有静音标识的唤醒词的发音,包括:当采用解码算法识别所述标注静音标识的唤醒词时,保持静音,直至所述唤醒词发音结束。结合第一方面,本专利技术在第一方面的第三实施方式中,所述唤醒词的发音的行首标注静音标识,使得在语音识别时跳过标有静音标识的唤醒词的发音之后,所述方法还包括:采用解码算法识别所述语音中的除唤醒词以外的其他语音。第二方面,本专利技术实施例提供了一种语音识别装置,所述装置包括:接收模块,配置为接收客户端发送的用户语音;第一识别模块,根据所述语音的声学特征,识别所述语音中的唤醒词对应的发音;静音模块,配置为将所述唤醒词的发音标注静音标识,使得在语音识别时跳过标有静音标识的唤醒词的发音。结合第二方面,本专利技术在第二方面的第一实施方式中,所述第一识别模块包括:匹配子模块,配置为将所述发音与识别路径中预先存储的唤配词匹配;若所述发音中存在一段语音与所述识别路径中预先存储的唤配词匹配,则将所述一段语音识别为唤醒词。结合第二方面,本专利技术在第二方面的第二实施方式中,所述静音模块包括:静音子模块,配置为当采用解码算法识别所述标注静音标识的唤醒词时,保持静音,直至所述唤醒词发音结束。结合第二方面,本专利技术在第二方面的第三实施方式中,所述装置还包括:第二识别模块,配置为当所述唤醒词的发音的行首标注静音标识,使得在语音识别时跳过标有静音标识的唤醒词的发音完成之后,采用解码算法识别所述语音中的除唤醒词以外的其他语音。第三方面,所述服务器包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述第一方面中语音识别方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,用于存储语音识别装置所用的计算机软件指令,其包括用于执行上述第一方面中语音识别方法为语音识别装置所涉及的程序。上述技术方案中的一个技术方案具有如下优点或有益效果:本专利技术实施例的技术方案对用户语音中的唤醒词标注为静音标识,以使得在语音识别时跳过标有静音标识的唤醒词的发音,这样在采用复杂的解码算法对语音进行识别时,避免对与用户指示无关的唤醒词进行识别,减小了解码算法的数据处理量,提高了语音识别的效率。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1为本专利技术实施例一的语音识别方法的流程图;图2为本专利技术实施例二的语音识别方法的流程图;图3为本专利技术实施例三的语音识别装置的示意图;图4为本专利技术实施例四的服务器的示意图。具体实施方式在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。一语即达(one-shot)是目前比较热门一种语音交互技术。这种技术采用“唤醒词+语音语义识别”一体化方式,实现唤醒词与语音操控之间零间隔、零延迟、无缝对接,摒弃传统的一问一答的形式,极大减少用户语音操控的步骤,实现信息反馈,化繁为简,实现简便操作。one-shot的一大特点是识别唤醒与语义理解一体化,保证语音交互的统一性与连贯性,完成操控。举个简单的例子来讲,过去智能语音的交互方式为一问一答,用户发出唤醒词指令,需要设备反馈待机信息,然后才能开始交互,例如:用户:你好小度(用户发送唤醒词以唤醒设备)。设备:有什么可以帮您?(电子设备对唤醒词进行反馈,表示处于信息接收状态)用户:我要去机场。设备:开始为您导航去机场。One-shot技术却可以一语即中,实现“唤醒词+语音语义识别”一体化,比如实现这样的交互:用户:你好小度,我要去机场。设备:开始为您导航去机场。相比传统的语音交互技术,这样的体验似乎更具效率。语音唤醒和常用的语音识别指令存储在本地,客户端(或电子设备)接收用户语音,并对用户语音能够准确及时的响应。与此同时,将用户语音发送至云服务器,由云服务器处理语音识别和语义理解。客户端加云服务器的混合引擎处理,既保证了响应速度也确保了交互的精准。但是传统技术中客户端将用户语音发送至服务器,服务器需要对用户的全部语音进行识别,而且这段语音中可能存在一些与用户指示不相关的信息。为此,本专利技术实施例提供一种语音识别方法,在云服务器进行语音识别时,将与用户指示不相关的唤醒词过滤掉,以提高云服务器的语音识别效率。实施例一本专利技术实施例提供一种语音识别方法。如图1所示,为本专利技术实施例的语音识别方法的流程图。本专利技术实施例的语音识别方法包括如下步骤:S101,接收客户端发送的用户语音。如上所述,本专利技术实施例的执行主体为云服务器。其中,客户端可以包括一些具备语音交互功能的电子设备,如音响、具备语音交互功能的机器人、车载语音交互系统、具备语音交互功能的查询类应用程序和地图应用程序等等。当客户端检测到用户语音,可以根据客户端本地存储的语音唤醒和常用的语音识别指令确定存在唤醒词,这时客户端被唤醒。然后客户端将用户语音发送至云服务器。S102,根本文档来自技高网...
语音识别方法、装置及服务器

【技术保护点】
一种语音识别方法,其特征在于,所述方法包括:接收客户端发送的用户语音;根据所述语音的声学特征,识别所述语音中的唤醒词对应的发音;将所述唤醒词的发音标注静音标识,使得在语音识别时跳过标有静音标识的唤醒词的发音。

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:接收客户端发送的用户语音;根据所述语音的声学特征,识别所述语音中的唤醒词对应的发音;将所述唤醒词的发音标注静音标识,使得在语音识别时跳过标有静音标识的唤醒词的发音。2.根据权利要求1所述的方法,其特征在于,根据所述语音的声学特征,识别所述语音中的唤醒词对应的发音,包括:将所述发音与识别路径中预先存储的唤配词匹配;若所述发音中存在一段语音与所述识别路径中预先存储的唤配词匹配,则将所述一段语音识别为唤醒词。3.根据权利要求1所述的方法,其特征在于,将所述唤醒词的发音标注静音标识,使得在语音识别时跳过标有静音标识的唤醒词的发音,包括:当采用解码算法识别所述标注静音标识的唤醒词时,保持静音,直至所述唤醒词发音结束。4.根据权利要求1所述的方法,其特征在于,所述唤醒词的发音的行首标注静音标识,使得在语音识别时跳过标有静音标识的唤醒词的发音之后,所述方法还包括:采用解码算法识别所述语音中的除唤醒词以外的其他语音。5.一种语音识别装置,其特征在于,所述装置包括:接收模块,配置为接收客户端发送的用户语音;第一识别模块,根据所述语音的声学特征,识别所述语音中的唤醒词对应的发音;...

【专利技术属性】
技术研发人员:王知践钱胜
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1