【技术实现步骤摘要】
本专利技术涉及,特别是涉及一种H.248协议作为控制协议来实现语音识别功能的方法。
技术介绍
语音识别功能指把用户输入的语音,按规定的语法识别,转换成文本。如在某个交互应用中,系统先向用户播放提示音“你需要水,可乐,还是果汁?”。用户可以通过语音回答,用户发音只能是包括“水,可乐,果汁,不需要”这几个关键词的语音,系统可以对用户的语音识别,然后向用户提供选择的商品。在固定或者移动网络应用中,要求用户输入时,一般有以下两种方法一种方法是用户输入DTMF(Dual Tone Multi-Frequency,双音多频)音。如在上述的交互应用中,当用户输入1时,表示选择“水”;输入2时,表示选择“可乐”;输入3时,表示选择“果汁”,输入其它键,表示“不需要”。这种方法在H.248协议中已有完善的定义。另一种方法是用户直接输入语音,系统可以将用户输入的语音传输给另一通话方,或者进行录音,或者进行语音识别处理。通过语音识别处理可以完成和DTMF输入类似的功能,系统可以根据用户的语音来确定用户的选择。使用语音识别的优点是,用户可以通过语音直接和系统交互,不需要其它辅助输入设 ...
【技术保护点】
一种实现语音识别功能的方法,其特征在于,媒体资源控制设备通过H.248协议,控制媒体资源处理设备实现对用户输入语音的识别,该方法包括以下步骤:步骤一,媒体资源控制设备通过定义H.248协议扩展包,在H.248消息中携带扩展包参数,指 示媒体资源处理设备执行与该参数相应的语音识别处理;步骤二,媒体资源处理设备根据上述消息中的参数调用语音识别器执行语音识别处理;以及步骤三,媒体资源处理设备在完成语音识别后将识别结果上报媒体资源控制设备。
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。