一种嘈杂环境连续语音对话的处理方法技术

技术编号：24253145 阅读：69 留言：0更新日期：2020-05-23 00:25

本发明专利技术公开了一种嘈杂环境连续语音对话的处理方法，设计“导医”作为Session会话控制启动的标志，该语音指令同时作为音色滤波标识；在监听状态下，每次捕获到“导医”语音指令，都会对应启动一个Session会话，并记录该指令的音色波形文件。在该会话中，以启动指令“导医”的音色波形文件作为滤波模板，仅允许符合该模板的波形通过，解析相关的指令执行。若在7.2秒未检测到同音色的指令，则程序返回至监听状态。通过上述方式，本发明专利技术能够。

A processing method of continuous voice conversation in noisy environment

全部详细技术资料下载

【技术实现步骤摘要】
一种嘈杂环境连续语音对话的处理方法
本专利技术涉及自助设备语音交互
，特别是涉及一种嘈杂环境下自助设备连续语音对话的处理方法。
技术介绍
传统的个人语音识别交互技术，普遍采用录制语音直接发送至服务器的方式，由服务程序识别、转换为文字、关联语义。而医院的语音交互则存在环境嘈杂、人员音色、音高混合的难题。在自助语音交互的应用中，由于交互对象为任意的人员及位置，由此产生的音色、音高不同，并且处于连续语音识别状态；实际操作中自助设备语音交互时，存在附近经过人员的声音被当作语音指令，附近多台自助设备时，多人同时下达符合规范的指令的情况，因此将会存在语音识别到非使用人员的声音的情况，进而导致程序执行错误的指令。
技术实现思路
本专利技术主要解决的技术问题是提供一种嘈杂环境连续语音对话的处理方法，能够保证在嘈杂环境、连续一对一语音交互的准确性及正确性。为解决上述技术问题，本专利技术采用的一个技术方案是：提供一种嘈杂环境连续语音对话的处理方法，包括以下步骤：一、在实时音频流流入模块上，添加名...

【技术保护点】
1.一种嘈杂环境连续语音对话的处理方法，其特征在于，包括以下步骤：/n步骤一、在实时音频流流入模块上，添加名为Session计时器的类、音色剥离模块及音色滤波模块，调用设置计时器的函数，音色剥离及滤波模块以钩子方式自动运行；/n步骤二、设计“导医”作为Session启动的标志，该语音指令同时作为音色滤波标识；/n步骤三、实时读取麦克风回传的语音指令；/n步骤四、判断是否已经存在新Session，并且Session未超时，则用上个会话保存的滤波文件进行过滤新的语音流；不存在会话或已超时则判断是否为“导医”，是则创建新会话，否则忽略该语音指令；有效语音流抛给下个处理者，无效音频流直接丢弃；/n步骤...

【技术特征摘要】
1.一种嘈杂环境连续语音对话的处理方法，其特征在于，包括以下步骤：
步骤一、在实时音频流流入模块上，添加名为Session计时器的类、音色剥离模块及音色滤波模块，调用设置计时器的函数，音色剥离及滤波模块以钩子方式自动运行；
步骤二、设计“导医”作为Session启动的标志，该语音指令同时作为音色滤波标识；
步骤三、实时读取麦克风回传的语音指令；
步骤四、判断是否已经存在新Session，并且Session未超时，则用上个会话保存的滤波文件进行过滤...

【专利技术属性】
技术研发人员：莫仁超，于刚毅，胡焱，
申请(专利权)人：浪潮金融信息技术有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人