一种实现语音识别功能的方法技术

技术编号：3504383 阅读：123 留言：0更新日期：2012-04-11 18:40

一种实现语音识别功能的方法，其中，媒体资源控制设备通过Ｈ．２４８协议，控制媒体资源处理设备实现对用户输入语音的识别。该方法包括以下步骤：媒体资源控制设备通过定义Ｈ．２４８协议扩展包，在Ｈ．２４８消息中携带扩展包参数，指示媒体资源处理设备执行与该参数相应的语音识别处理；媒体资源处理设备根据上述消息中的参数调用语音识别器执行语音识别处理；以及，媒体资源处理设备在完成语音识别后将识别结果上报媒体资源控制设备。该方法可以实现用户输入的普通语音的识别，用户可以通过语音直接和系统交互，不需要其它辅助输入设备，从而简化了用户的输入方式。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及，特别是涉及一种H.248协议作为控制协议来实现语音识别功能的方法。
技术介绍
语音识别功能指把用户输入的语音，按规定的语法识别，转换成文本。如在某个交互应用中，系统先向用户播放提示音“你需要水，可乐，还是果汁？”。用户可以通过语音回答，用户发音只能是包括“水，可乐，果汁，不需要”这几个关键词的语音，系统可以对用户的语音识别，然后向用户提供选择的商品。在固定或者移动网络应用中，要求用户输入时，一般有以下两种方法一种方法是用户输入DTMF(Dual Tone Multi-Frequency，双音多频)音。如在上述的交互应用中，当用户输入1时，表示选择“水”；输入2时，表示选择“可乐”；输入3时，表示选择“果汁”，输入其它键，表示“不需要”。这种方法在H.248协议中已有完善的定义。另一种方法是用户直接输入语音，系统可以将用户输入的语音传输给另一通话方，或者进行录音，或者进行语音识别处理。通过语音识别处理可以完成和DTMF输入类似的功能，系统可以根据用户的语音来确定用户的选择。使用语音识别的优点是，用户可以通过语音直接和系统交互，不需要其它辅助输入设...

【技术保护点】
一种实现语音识别功能的方法，其特征在于，媒体资源控制设备通过Ｈ．２４８协议，控制媒体资源处理设备实现对用户输入语音的识别，该方法包括以下步骤：步骤一，媒体资源控制设备通过定义Ｈ．２４８协议扩展包，在Ｈ．２４８消息中携带扩展包参数，指示媒体资源处理设备执行与该参数相应的语音识别处理；步骤二，媒体资源处理设备根据上述消息中的参数调用语音识别器执行语音识别处理；以及步骤三，媒体资源处理设备在完成语音识别后将识别结果上报媒体资源控制设备。

【技术特征摘要】

【专利技术属性】
技术研发人员：陈诚，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：94[中国|深圳]

全部详细技术资料下载我是这个专利的主人