多信源语音区分识别系统技术方案

技术编号：18661983 阅读：37 留言：0更新日期：2018-08-11 16:09

本实用新型专利技术公开了一种多信源语音区分识别系统，包括至少两路音频处理模块，用于与麦克风连接；计算机设备，包括用于语音识别的语音识别模块，所述语音识别模块根据从所述音频处理模块获取的硬件标识区分语音信源，并将经语音识别后的文本内容与相应的语音信源关联记录。本实用新型专利技术能够在无人干预或操作下，解决同一台计算机设备上多人同步或不同步谈话时，自动将语音转文字，正确区分语音信源，自动对应输出信源的文本内容，最大限度减少人工操作，降低工作人员的劳动强度，保障了语音内容的真实客观性，提高整体工作效率。

Multi source speech recognition and recognition system

The utility model discloses a multi-source speech discrimination and recognition system, which comprises at least two audio processing modules for connecting to a microphone; computer equipment, including a speech recognition module for speech recognition, which distinguishes speech sources according to hardware identification obtained from the audio processing module. And record the text content after speech recognition with the corresponding voice source. The utility model can automatically translate the voice into words, correctly distinguish the voice source, automatically correspond to the text content of the output source, minimize the manual operation, reduce the labor intensity of the staff, and guarantee the language when many people talk synchronously or asynchronously on the same computer equipment without any interference or operation. The real objectivity of the content of the music improves the efficiency of the whole work.

全部详细技术资料下载

【技术实现步骤摘要】
多信源语音区分识别系统
本技术涉及语音信源识别领域，特别涉及一种多信源语音区分识别系统。
技术介绍
近年来，随着语音设备和智能语音转文字技术的广泛推行，推动了现场办案(现场办公，会议)对话等工作智能化。然而，基于目前的语音设备和软件并不能实现区分多人同时语音转文字，依靠的是传统的人为输入方式，实施过程繁杂，效率低下。在利用语音设备或软件进行文本记录时，信源区分是人为切换，导致记录过程中出现误录，特别是在长时间工作的情况下工作人员处于疲劳状况，更不能准确的区分信源讲话内容。而且，工作人员可能加入自己的见解和语句上修饰，由此导致不能准确地反映当时的对话场景，影响文本记录内容的真实性。在使用现有智能语音转文字设备或软件时，大多是基于个人或人机对话的智能语音转文字技术实现，因为多信源同步或异步进行语音对话，声音重叠使软件无法区分信源各自语音内容。导致要由人工确认信息，未能自动记录完整的文字记录。
技术实现思路
为了解决上述的至少一个问题，本技术提供了一种全新的多语音自动识别信源技术方法。根据本技术的一个实施方式，提供了一种多信源语音区分识别系统，包括：至少两路音频处理模块，用于与麦克风连接；计算机设备，包括用于语音识别的语音识别模块，所述语音识别模块根据从所述音频处理模块获取的硬件标识区分语音信源，并将经语音识别后的文本内容与相应的语音信源关联记录。在上述的多信源语音区分识别系统中，所述语音识别模块包括优先级设置模块，用于设置语音的信息来源的优先级。在上述的多信源语音区分识别系统中，所述音频处理模块是具备处理音频数据能力并且具有通讯能力的模块。在上述的多信源语音区分识别系...

【技术保护点】
1.一种多信源语音区分识别系统，其特征在于，包括：至少两路音频处理模块，用于与麦克风连接；计算机设备，包括用于语音识别的语音识别模块，所述语音识别模块根据从所述音频处理模块获取的硬件标识区分语音信源，并将经语音识别后的文本内容与相应的语音信源关联记录。

【技术特征摘要】
1.一种多信源语音区分识别系统，其特征在于，包括：至少两路音频处理模块，用于与麦克风连接；计算机设备，包括用于语音识别的语音识别模块，所述语音识别模块根据从所述音频处理模块获取的硬件标识区分语音信源，并将经语音识别后的文本内容与相应的语音信源关联记录。2.根据权利要求1所述的多信源语音区分识别系统，其特征在于：所述语音识别模块包括优先级设置模块，用于设置语音的信息来源的优先级。3.根据权利要求1所述的多信源语音区分识别系统，其特征在于：所述音频处理模块是具备处理音频数据能力并且具有通讯能力的模块。4.根据权利要求3所述的多信源语音区分识别系统，其特征在于：所述音频处理模块包括USB声卡、PCI-E声卡和/或单片机声卡。5.根据权利要求4所述的多信源语音区分识别系统，其特征在于：还包括USB分线器，用于将所述U...

【专利技术属性】
技术研发人员：韦海明，
申请(专利权)人：广州宝镜智能科技有限公司，
类型：新型
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人