【技术实现步骤摘要】
一种嘈杂环境连续语音对话的处理方法
本专利技术涉及自助设备语音交互
,特别是涉及一种嘈杂环境下自助设备连续语音对话的处理方法。
技术介绍
传统的个人语音识别交互技术,普遍采用录制语音直接发送至服务器的方式,由服务程序识别、转换为文字、关联语义。而医院的语音交互则存在环境嘈杂、人员音色、音高混合的难题。在自助语音交互的应用中,由于交互对象为任意的人员及位置,由此产生的音色、音高不同,并且处于连续语音识别状态;实际操作中自助设备语音交互时,存在附近经过人员的声音被当作语音指令,附近多台自助设备时,多人同时下达符合规范的指令的情况,因此将会存在语音识别到非使用人员的声音的情况,进而导致程序执行错误的指令。
技术实现思路
本专利技术主要解决的技术问题是提供一种嘈杂环境连续语音对话的处理方法,能够保证在嘈杂环境、连续一对一语音交互的准确性及正确性。为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种嘈杂环境连续语音对话的处理方法,包括以下步骤:一、在实时音频流流入模块上,添加名为Session计时器的类、音色剥离模块及音色滤波模块,调用设置计时器的函数,音色剥离及滤波模块以钩子方式自动运行;Session意为会话控制;计时器设置时间为7.2秒;二、设计“导医”作为Session启动的标志,该语音指令同时作为音色滤波标识;三、实时读取麦克风回传的语音指令;四、判断是否已经存在新Session,并且Session未超时,则用上个会话保存的滤波文件进行 ...
【技术保护点】
1.一种嘈杂环境连续语音对话的处理方法,其特征在于,包括以下步骤:/n步骤一、在实时音频流流入模块上,添加名为Session计时器的类、音色剥离模块及音色滤波模块,调用设置计时器的函数,音色剥离及滤波模块以钩子方式自动运行;/n步骤二、设计“导医”作为Session启动的标志,该语音指令同时作为音色滤波标识;/n步骤三、实时读取麦克风回传的语音指令;/n步骤四、判断是否已经存在新Session,并且Session未超时,则用上个会话保存的滤波文件进行过滤新的语音流;不存在会话或已超时则判断是否为“导医”,是则创建新会话,否则忽略该语音指令;有效语音流抛给下个处理者,无效音频流直接丢弃;/n步骤五、处理滤波文件处理后的音频流,判断是否为有效指令,有效指令则执行相关操作,无效指令进行提示;/n步骤六、指令处理完成后,会话计时归零,并进入监听状态;/n步骤七、实时监听麦克风音频流。/n
【技术特征摘要】
1.一种嘈杂环境连续语音对话的处理方法,其特征在于,包括以下步骤:
步骤一、在实时音频流流入模块上,添加名为Session计时器的类、音色剥离模块及音色滤波模块,调用设置计时器的函数,音色剥离及滤波模块以钩子方式自动运行;
步骤二、设计“导医”作为Session启动的标志,该语音指令同时作为音色滤波标识;
步骤三、实时读取麦克风回传的语音指令;
步骤四、判断是否已经存在新Session,并且Session未超时,则用上个会话保存的滤波文件进行过滤...
【专利技术属性】
技术研发人员:莫仁超,于刚毅,胡焱,
申请(专利权)人:浪潮金融信息技术有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。