多信源语音区分识别系统技术方案

技术编号:18661983 阅读:37 留言:0更新日期:2018-08-11 16:09
本实用新型专利技术公开了一种多信源语音区分识别系统,包括至少两路音频处理模块,用于与麦克风连接;计算机设备,包括用于语音识别的语音识别模块,所述语音识别模块根据从所述音频处理模块获取的硬件标识区分语音信源,并将经语音识别后的文本内容与相应的语音信源关联记录。本实用新型专利技术能够在无人干预或操作下,解决同一台计算机设备上多人同步或不同步谈话时,自动将语音转文字,正确区分语音信源,自动对应输出信源的文本内容,最大限度减少人工操作,降低工作人员的劳动强度,保障了语音内容的真实客观性,提高整体工作效率。

Multi source speech recognition and recognition system

The utility model discloses a multi-source speech discrimination and recognition system, which comprises at least two audio processing modules for connecting to a microphone; computer equipment, including a speech recognition module for speech recognition, which distinguishes speech sources according to hardware identification obtained from the audio processing module. And record the text content after speech recognition with the corresponding voice source. The utility model can automatically translate the voice into words, correctly distinguish the voice source, automatically correspond to the text content of the output source, minimize the manual operation, reduce the labor intensity of the staff, and guarantee the language when many people talk synchronously or asynchronously on the same computer equipment without any interference or operation. The real objectivity of the content of the music improves the efficiency of the whole work.

【技术实现步骤摘要】
多信源语音区分识别系统
本技术涉及语音信源识别领域,特别涉及一种多信源语音区分识别系统。
技术介绍
近年来,随着语音设备和智能语音转文字技术的广泛推行,推动了现场办案(现场办公,会议)对话等工作智能化。然而,基于目前的语音设备和软件并不能实现区分多人同时语音转文字,依靠的是传统的人为输入方式,实施过程繁杂,效率低下。在利用语音设备或软件进行文本记录时,信源区分是人为切换,导致记录过程中出现误录,特别是在长时间工作的情况下工作人员处于疲劳状况,更不能准确的区分信源讲话内容。而且,工作人员可能加入自己的见解和语句上修饰,由此导致不能准确地反映当时的对话场景,影响文本记录内容的真实性。在使用现有智能语音转文字设备或软件时,大多是基于个人或人机对话的智能语音转文字技术实现,因为多信源同步或异步进行语音对话,声音重叠使软件无法区分信源各自语音内容。导致要由人工确认信息,未能自动记录完整的文字记录。
技术实现思路
为了解决上述的至少一个问题,本技术提供了一种全新的多语音自动识别信源技术方法。根据本技术的一个实施方式,提供了一种多信源语音区分识别系统,包括:至少两路音频处理模块,用于与麦克风连接;计算机设备,包括用于语音识别的语音识别模块,所述语音识别模块根据从所述音频处理模块获取的硬件标识区分语音信源,并将经语音识别后的文本内容与相应的语音信源关联记录。在上述的多信源语音区分识别系统中,所述语音识别模块包括优先级设置模块,用于设置语音的信息来源的优先级。在上述的多信源语音区分识别系统中,所述音频处理模块是具备处理音频数据能力并且具有通讯能力的模块。在上述的多信源语音区分识别系统中,所述音频处理模块包括USB声卡、PCI-E声卡和/或单片机声卡。在上述的多信源语音区分识别系统中,还包括USB分线器,用于将所述USB声卡连接至所述计算机设备。在上述的多信源语音区分识别系统中,所述至少两路音频处理模块包括内置音频处理模块和/或外置音频处理模块,并且所述内置音频处理模块设置在所述计算机设备内。在上述的多信源语音区分识别系统中,所述计算机设备为便携式计算机、台式计算机、移动终端或工控电脑。在上述的多信源语音区分识别系统中,还包括多个麦克风,所述多个麦克风包括有线麦克风和/或无线麦克风。在上述的多信源语音区分识别系统中,所述音频处理模块包括麦克风无线接收器和/或有线麦克风接口。在上述的多信源语音区分识别系统中,所述无线麦克风包括2.4G无线发射模块;所述麦克风无线接收器包括2.4G无线接收模块。本技术提供的多信源语音区分识别系统能够实时自动的区分多信源语音对话并将语音转化成对应信源所述的文字信息,记录时可以不用人工介入,不仅减少了劳动力投入,而且极大地提高了录入的工作效率,解决了工作人员长时间超负荷工作时导致笔录出现错误的情况。而且,本技术的多信源语音区分识别系统采用了多路音频处理模块,语音识别模块根据从各个音频处理模块获取的硬件标识区分语音信源,并将经语音识别后的文本内容与相应的语音信源关联地记录,因此,能够智能定位发言信源,精确地输入发言者对话内容。由于本技术提供的多信源语音区分识别系统的识别率高,能够区分不同的语音信源,因此,能恢复完整对话内容,保证语音记录完整性,无缝对接,当然,也就减少人为的文字修饰,保障了发言的真实性。此外,在计算机设备没有音频处理模块或者只有一个音频处理模块时,利用了外置音频处理模块,而且外置音频处理模块与计算机设备通过USB接口或通讯接口进行连接,因此,可以不对现有的计算机设备做硬件上的改造也能够实现多信源语音区分。由于可以采用USB接口与外置音频处理模块连接,大大地拓展了本技术的多信源语音区分识别系统可应用的地域和可应用的设备,即使在偏远地区或者在仅具备有限硬件条件的地方也能方便地应用本技术的系统。本技术的多信源语音区分识别系统能使计算机操作更智能化、简单化、人性化等优点,大大提高了语音信源识别的自动化水平,其可广泛用于司法、执法、政务、商务、医疗会诊、会议记录、教学等工作,简化和方便了司法、执法等工作的后续的事务性工作,有效地提高了工作效率。附图说明为了更清楚地说明本技术的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对本技术保护范围的限定。图1为本技术的多信源语音区分识别系统的一个实施例的示意性结构图。主要元件符号说明:100-计算机设备;110-语音识别模块;120-内置音频处理模块;130-外置音频处理模块;140-麦克风。具体实施方式为使本技术的目的、技术方案及优点更加清楚明白,以下参照附图结合实施例,对本技术进一步详细说明。在下文中,将更全面地描述本技术的各种实施例。本技术可具有各种实施例,并且可在其中做出调整和改变。然而,应理解:不存在将本技术的各种实施例限于在此公开的特定实施例的意图,而是应将本技术理解为涵盖落入本技术的各种实施例的精神和范围内的所有调整、等同物和/或可选方案。在下文中,可在本技术的各种实施例中使用的术语“包括”或“可包括”指示所公开的功能、操作或元件的存在,并且不限制一个或更多个功能、操作或元件的增加。此外,如在本技术的各种实施例中所使用,术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合,并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。在本技术的各种实施例中,表述“A或/和B”包括同时列出的文字的任何组合或所有组合,例如,可包括A、B、以及A和B二者。在本技术的各种实施例中使用的表述(诸如“第一”、“第二”等)可修饰在各种实施例中的各种组成元件,不过可不限制相应组成元件。例如,以上表述并不限制所述元件的顺序和/或重要性。以上表述仅用于将一个元件与其它元件区别开的目的。例如,第一用户装置和第二用户装置指示不同用户装置,尽管二者都是用户装置。例如,在不脱离本技术的各种实施例的范围的情况下,第一元件可被称为第二元件,同样地,第二元件也可被称为第一元件。应注意到:在本技术中,除非另有明确的规定和定义,“安装”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接、也可以是可拆卸连接、或者一体地连接;可以是机械连接,也可以是电连接;可以是直接连接,也是可以通过中间媒介间接相连;可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本技术中的具体含义。在本技术的各种实施例中使用的术语仅用于描述特定实施例的目的并且并非意在限制本技术的各种实施例。除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语)具有与本技术的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关
中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义,除非在本技术的各种实施例中被清楚地限定。为解本文档来自技高网
...

【技术保护点】
1.一种多信源语音区分识别系统,其特征在于,包括:至少两路音频处理模块,用于与麦克风连接;计算机设备,包括用于语音识别的语音识别模块,所述语音识别模块根据从所述音频处理模块获取的硬件标识区分语音信源,并将经语音识别后的文本内容与相应的语音信源关联记录。

【技术特征摘要】
1.一种多信源语音区分识别系统,其特征在于,包括:至少两路音频处理模块,用于与麦克风连接;计算机设备,包括用于语音识别的语音识别模块,所述语音识别模块根据从所述音频处理模块获取的硬件标识区分语音信源,并将经语音识别后的文本内容与相应的语音信源关联记录。2.根据权利要求1所述的多信源语音区分识别系统,其特征在于:所述语音识别模块包括优先级设置模块,用于设置语音的信息来源的优先级。3.根据权利要求1所述的多信源语音区分识别系统,其特征在于:所述音频处理模块是具备处理音频数据能力并且具有通讯能力的模块。4.根据权利要求3所述的多信源语音区分识别系统,其特征在于:所述音频处理模块包括USB声卡、PCI-E声卡和/或单片机声卡。5.根据权利要求4所述的多信源语音区分识别系统,其特征在于:还包括USB分线器,用于将所述U...

【专利技术属性】
技术研发人员:韦海明
申请(专利权)人:广州宝镜智能科技有限公司
类型:新型
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1