一种语音数据识别方法及装置制造方法及图纸

技术编号：11173125 阅读：108 留言：0更新日期：2015-03-20 02:27

本发明专利技术实施例公开了一种语音数据识别方法及装置，所述方法包括：获取语音数据；对所述语音数据进行识别，如果识别出所述语音数据为命令语音数据，则确定所述命令语音数据对应的命令代码；将所述命令代码通过命令控制信道发送给桌面云服务端，以便于所述桌面云服务端根据所述命令代码确定对应的标准语音数据，并将所述标准语音数据插入到音频重定向数据队列中进行识别。本发明专利技术实施例解决了现有技术中，采用音频有损编解码或实时传输协议方式，都会导致语音识别成功率下降的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音数据识别方法及装置
本专利技术涉及通信
，特别涉及一种语音数据识别方法及装置。
技术介绍
在现有的桌面云重定向场景中，为了确保在网络传输的时候得到最小的带宽消耗并降低传输时延，桌面云客户端对音频数据通常会采用有损编码方式（比如采用speex、 vobis音频编码方式等)，即针对原始PCM数据进行有损压缩，然后将压缩后的数据传输给桌面云服务器，由桌面云服务器解压后还原成PCM数据，并将还原后的PCM数据发送给音频重定向驱动程序，以便于完成相应音频操作。但是，在该语音识别的场景中，语音指令识别成功率，将取决于输入的PCM音频数据是否完整清晰，然而，在现有的重定向音频编解码的过程中，由于采用了有损压缩，虽然减小了带宽和降低传输时延，但是解压后音质都有所下降，从而导致语音指令的识别成功率相应的下降。当然，在现有的桌面云重定向场景中，桌面云客户端对音频数据也会采取实时传输协议(例如RTP)来进行重定向传输。这种音频数据传输方式，虽然实时性很强，但是可靠性较低，会造成语音指令数据存在丢包的可能行，从而降低了语音指令的完整性，进而导致语音指令的识别成功率相应的下降。在对现有技术的研究和实践过程中，本专利技术的专利技术人发现，现有的桌面云重定向场景中，无论采用音频有损编解码方式，还是采用实时传输协议方式，均会导致语音识别成功率下降的问题。
技术实现思路
本专利技术实施例中提供了一种语音数据识别方法及装置，以解决现有技术中，采用音频有损编解码或实时传输协议方式，都会导致语音识别...

【技术保护点】
一种语音数据识别方法，其特征在于，包括：获取语音数据；对所述语音数据进行识别，如果识别出所述语音数据为命令语音数据，则确定所述命令语音数据对应的命令代码；将所述命令代码通过命令控制信道发送给桌面云服务端，以便于所述桌面云服务端根据所述命令代码确定对应的标准语音数据，并将所述标准语音数据插入到音频重定向数据队列中进行识别。

【技术特征摘要】
1. 一种语音数据识别方法，其特征在于，包括：获取语音数据；对所述语音数据进行识别，如果识别出所述语音数据为命令语音数据，则确定所述命令语音数据对应的命令代码；将所述命令代码通过命令控制信道发送给桌面云服务端，以便于所述桌面云服务端根据所述命令代码确定对应的标准语音数据，并将所述标准语音数据插入到音频重定向数据队列中进行识别。2. 根据权利要求1所述的方法，其特征在于，还包括：如果识别出所述语音数据为普通语音数据，则对所述普通语音数据进行音频编码，并将编码后的语音数据通过数据通道发送给桌面云服务端，以便于所述桌面云服务端将所述普通语音数插入所述音频重定向数据队列中进行识别。3. 根据权利要求2所述的方法，其特征在于，还包括：在获取所述语音数据后，判断所述语音数据的模式；如果所述语音数据的模式为语音识别模式，则执行所述对所述语音数据进行识别的步骤；如果所述语音数据的模式为普通语音模式，则执行所述对所述普通语音数据进行音频编码的步骤。4. 根据权利要求1至3任一项所述的方法，其特征在于，还包括：预先存储配置的所述命令语音数据，以及所述命令语音数据对应的命令代码。5. 根据权利要求4所述的方法，其特征在于，所述对所述语音数据进行识别，具体包括：将所述语音数据与存储的所述命令语音数据进行匹配，如果匹配成功，则所述语音数据为可识别的命令语音数据。6. 根据权利要求5所述的方法，其特征在于，还包括：接收管理系统下发的更新命令，所述更新命令包括：更新后的命令语音数据以及所述命令语音数据对应的命令代码；根据所述更新命令更新存储的所述命令语音数据，以及所述命令语音数据对应的命令代码。7. -种语音数据识别方法，其特征在于，包括：接收桌面云客户端通过命令控制信道发送的命令代码，所述命令代码对应可识别的命令语音数据；根据所述命令代码确定对应的标准语音数据；将所述标准语音数据插入到音频重定向数据队列中进行识别。8. 根据权利要求7所述的方法，其特征在于，还包括：接收桌面云客户端通过数据信道发送的普通语音数据；对所述普通语音数据进行音频解码，并将解码后的普通语音数据插入所述音频重定向数据队列中进行识别。9. 根据权利要求7或8所述的方法，其特征在于，还包括：预先存储配置的所述命令代码，以及所述命令代码对应的标准语音数据。10. 根据权利要求9所述的方法，其特征在于，还包括：接收管理系统下发的更新命令，所述更新命令包括：更新的命令代码以及所述命令代码对应的标准语音数据；根据所述更新命令更新所述命令代码以及所述命令代码对应的标准语音数据。11. 一种语音数据识别方法，其特征在于，包括：接收桌面云客户端通过命令控制信道发送的命令代码，所述命令代码对应命令语音数据；根据所述命令代码调用对应的语音识别软件开发接口识别出所述命令语音数据对应的语音数据。12. -种语音数据识别装置，其特征在于，包括：获取单元，用于获取语音数据；识别单元，用于对所述语音数据进行识别；确定单元，用于在所述识别单元识别出所述语音数据为命令语音数据时，确定所述命令语音...

【专利技术属性】
技术研发人员：杜川，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人