一种嘈杂环境连续语音对话的处理方法技术

技术编号:24253145 阅读:57 留言:0更新日期:2020-05-23 00:25
本发明专利技术公开了一种嘈杂环境连续语音对话的处理方法,设计“导医”作为Session会话控制启动的标志,该语音指令同时作为音色滤波标识;在监听状态下,每次捕获到“导医”语音指令,都会对应启动一个Session会话,并记录该指令的音色波形文件。在该会话中,以启动指令“导医”的音色波形文件作为滤波模板,仅允许符合该模板的波形通过,解析相关的指令执行。若在7.2秒未检测到同音色的指令,则程序返回至监听状态。通过上述方式,本发明专利技术能够。

A processing method of continuous voice conversation in noisy environment

【技术实现步骤摘要】
一种嘈杂环境连续语音对话的处理方法
本专利技术涉及自助设备语音交互
,特别是涉及一种嘈杂环境下自助设备连续语音对话的处理方法。
技术介绍
传统的个人语音识别交互技术,普遍采用录制语音直接发送至服务器的方式,由服务程序识别、转换为文字、关联语义。而医院的语音交互则存在环境嘈杂、人员音色、音高混合的难题。在自助语音交互的应用中,由于交互对象为任意的人员及位置,由此产生的音色、音高不同,并且处于连续语音识别状态;实际操作中自助设备语音交互时,存在附近经过人员的声音被当作语音指令,附近多台自助设备时,多人同时下达符合规范的指令的情况,因此将会存在语音识别到非使用人员的声音的情况,进而导致程序执行错误的指令。
技术实现思路
本专利技术主要解决的技术问题是提供一种嘈杂环境连续语音对话的处理方法,能够保证在嘈杂环境、连续一对一语音交互的准确性及正确性。为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种嘈杂环境连续语音对话的处理方法,包括以下步骤:一、在实时音频流流入模块上,添加名为Session计时器的类、音色剥离模块及音色滤波模块,调用设置计时器的函数,音色剥离及滤波模块以钩子方式自动运行;Session意为会话控制;计时器设置时间为7.2秒;二、设计“导医”作为Session启动的标志,该语音指令同时作为音色滤波标识;三、实时读取麦克风回传的语音指令;四、判断是否已经存在新Session,并且Session未超时,则用上个会话保存的滤波文件进行过滤新的语音流;不存在会话或已超时则判断是否为“导医”,是则创建新会话,否则忽略该语音指令;有效语音流抛给下个处理者,无效音频流直接丢弃;五、处理滤波文件处理后的音频流,判断是否为有效指令,有效指令则执行相关操作,无效指令进行提示;六、指令处理完成后,会话计时归零,并进入监听状态;七、实时监听麦克风音频流。本专利技术的有益效果是:本专利技术设计出适用于语音的Session会话技术,该技术采用“导医”语音作为Session启动标志及音色剥离标识,在7.2秒内只有符合该音色标识的语音会被处理,其他音色的语音、环境噪音、回放声音则被过滤掉。若超时则启动下一个Session监听“导医”标识。保证了在嘈杂环境、连续一对一语音交互的准确性及正确性。附图说明图1是本专利技术一种嘈杂环境连续语音对话的处理方法的流程图;图2是所示一种嘈杂环境连续语音对话的处理方法的架构图。具体实施方式下面结合附图对本专利技术的较佳实施例进行详细阐述,以使本专利技术的优点和特征能更易于被本领域技术人员理解,从而对本专利技术的保护范围做出更为清楚明确的界定。请参阅图1和图2,本专利技术实施例包括:一种嘈杂环境连续语音对话的处理方法,包括以下步骤:一、在实时音频流流入模块上,添加名为Session计时器的类、音色剥离模块及音色滤波模块,调用设置计时器的函数,音色剥离及滤波模块以钩子方式自动运行;Session意为会话控制;计时器设置时间为7.2秒;二、设计“导医”作为Session启动的标志,该语音指令同时作为音色滤波标识;三、实时读取麦克风回传的语音指令;四、判断是否已经存在新Session,并且Session未超时,则用上个会话保存的滤波文件进行过滤新的语音流;不存在会话或已超时则判断是否为“导医”,是则创建新会话,否则忽略该语音指令;有效语音流抛给下个处理者,无效音频流直接丢弃;五、处理滤波文件处理后的音频流,判断是否为有效指令,有效指令则执行相关操作,无效指令进行提示;六、指令处理完成后,会话计时归零,并进入监听状态;七、实时监听麦克风音频流。本专利技术设计出适用于语音的Session会话技术,该技术采用“导医”语音作为Session启动标志及音色剥离标识,在7.2秒内只有符合该音色标识的语音会被处理,其他音色的语音、环境噪音、回放声音则被过滤掉。若超时则启动下一个Session监听“导医”标识。保证了在嘈杂环境、连续一对一语音交互的准确性及正确性。以上所述仅为本专利技术的实施例,并非因此限制本专利技术的专利范围,凡是利用本专利技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的
,均同理包括在本专利技术的专利保护范围内。本文档来自技高网
...

【技术保护点】
1.一种嘈杂环境连续语音对话的处理方法,其特征在于,包括以下步骤:/n步骤一、在实时音频流流入模块上,添加名为Session计时器的类、音色剥离模块及音色滤波模块,调用设置计时器的函数,音色剥离及滤波模块以钩子方式自动运行;/n步骤二、设计“导医”作为Session启动的标志,该语音指令同时作为音色滤波标识;/n步骤三、实时读取麦克风回传的语音指令;/n步骤四、判断是否已经存在新Session,并且Session未超时,则用上个会话保存的滤波文件进行过滤新的语音流;不存在会话或已超时则判断是否为“导医”,是则创建新会话,否则忽略该语音指令;有效语音流抛给下个处理者,无效音频流直接丢弃;/n步骤五、处理滤波文件处理后的音频流,判断是否为有效指令,有效指令则执行相关操作,无效指令进行提示;/n步骤六、指令处理完成后,会话计时归零,并进入监听状态;/n步骤七、实时监听麦克风音频流。/n

【技术特征摘要】
1.一种嘈杂环境连续语音对话的处理方法,其特征在于,包括以下步骤:
步骤一、在实时音频流流入模块上,添加名为Session计时器的类、音色剥离模块及音色滤波模块,调用设置计时器的函数,音色剥离及滤波模块以钩子方式自动运行;
步骤二、设计“导医”作为Session启动的标志,该语音指令同时作为音色滤波标识;
步骤三、实时读取麦克风回传的语音指令;
步骤四、判断是否已经存在新Session,并且Session未超时,则用上个会话保存的滤波文件进行过滤...

【专利技术属性】
技术研发人员:莫仁超于刚毅胡焱
申请(专利权)人:浪潮金融信息技术有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1