【技术实现步骤摘要】
会议语音实时转写方法及系统
本专利技术涉及智能语音领域,尤其涉及一种会议语音实时转写方法及系统。
技术介绍
在企业运作中,会议的召开十分普遍,当人们有问题需要解决,或需要作出权威的决定或决议时,一般都会开会。使参会人员了解到问题的重要性,确定出对应的方案后进行执行。为了保障后续对会议内容的查阅,通常会进行会议记录。在会议记录中,人工记录比较费劲,并且可能会遗漏会议中的某些要点,或不自主的掺杂一些个人的观点,使得会议记录不准确。随着智能语音的发展,如今会使用语音识别技术,来获取会议中发言人的语音,进行识别转写,得到会议记录。在实现本专利技术过程中,专利技术人发现相关技术中至少存在如下问题:由于参会人员众多,环境较为嘈杂,影响了语音识别的效果,并且并不是每个参会人员都会距离麦克风较近。对于距离麦克风较远的参会人员发言时,识别率就会进一步下降。如果会议中多人同时说话,那就严重影响了识别转写效果,无法进行记录。
技术实现思路
为了至少解决现有技术中嘈杂环境、麦克风与发言人较远、多人同时说话 ...
【技术保护点】
1.一种会议语音实时转写方法,应用于由多个麦克风阵列组成的麦克风集群,包括:/n接收多个麦克风阵列所采集的语音信号,其中,所述多个麦克风阵列分别配置在各自的参会区域中;/n对所述麦克风阵列采集的语音信号进行差分处理,以增强所述麦克风阵列中与说话的参会人员方向对应麦克风的语音信号;/n通过盲源分离对差分处理后的语音信号进行处理,提取出语音信号中所述说话的参会人员各自的语音信号;/n根据盲源分离后的语音信号进行位置估计,确定出所述说话的参会人员各自所在的参会区域;/n对确定出说话的参会区域的语音信号进行语音识别,实时转化成对应的文字。/n
【技术特征摘要】
1.一种会议语音实时转写方法,应用于由多个麦克风阵列组成的麦克风集群,包括:
接收多个麦克风阵列所采集的语音信号,其中,所述多个麦克风阵列分别配置在各自的参会区域中;
对所述麦克风阵列采集的语音信号进行差分处理,以增强所述麦克风阵列中与说话的参会人员方向对应麦克风的语音信号;
通过盲源分离对差分处理后的语音信号进行处理,提取出语音信号中所述说话的参会人员各自的语音信号;
根据盲源分离后的语音信号进行位置估计,确定出所述说话的参会人员各自所在的参会区域;
对确定出说话的参会区域的语音信号进行语音识别,实时转化成对应的文字。
2.根据权利要求1所述的方法,其中,在所述根据盲源分离后的语音信号进行位置估计,确定出所述说话的参会人员各自所在的参会区域之后,所述方法还包括:为参会人员提供转写模式,所述转写模式包括:中心模式、简单对话模式、全局模式;
若参会人员将转写模式配置为中心模式,当多个参会区域的参会人员说话时,按照预先配置的各参会区域的优先级,确定一个有效参会区域,对所述有效参会区域的语音信号进行语音识别;
若参会人员将转写模式配置为简单对话模式,仅仅对预先指定的两个参会区域内参会人员的语音信号进行语音识别;
若参会人员将转写模式配置为全局模式,依次对确定出说话的参会区域的语音信号进行语音识别。
3.根据权利要求2所述的方法,其中,当所述参会人员将转写模式配置为中心模式时,所述方法还包括:
将所述有效参会区域的位置信息发送到预先链接的旋转摄像头中,用于通过所述旋转摄像头实时记录参会人员说话过程的视频。
4.根据权利要求1所述的方法,其中,在所述接收多个麦克风阵列所采集的语音信号之后,所述方法还包括:
对所述语音信号进行分帧,以便于转写的实时处理;
对分帧处理后的语音信号加窗处理后进行傅里叶变换,用于将时域信号转换成频域信号的同时避免频谱泄漏。
5.根据权利要求1所述的方法,其中,所述麦克风阵列至少包括两个麦克风,所述麦克风间的距离小于2厘米。
6.一种会议语音...
【专利技术属性】
技术研发人员:何赛娟,张华兵,周强,
申请(专利权)人:苏州思必驰信息科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。