一种语音识别系统及方法技术方案

技术编号：15507915 阅读：146 留言：0更新日期：2017-06-04 02:24

本发明专利技术提供了一种语音识别系统及方法，系统包括：音频采集装置、应用客户端以及语音识别装置，所述音频采集装置，用于采集音频数据并向应用客户端发送激励码，所述激励码用于标识有声音输入的音频采集装置；所述应用客户端，用于根据所述的激励码和预存储的用户身份与音频采集装置对应关系确定用户身份；所述语音识别装置，将所述的音频数据转换成文字内容，并根据确定的用户身份生成包含用户身份的语音识别结果。本发明专利技术实现精确区分声音流中讲话人的角色，从而实现识别结果分角色展现讲话内容，极大增强了识别输出文本的易读和可用性。

Speech recognition system and method

The present invention provides a system and method for speech recognition system, including: audio acquisition device, application client and voice recognition device, the audio acquisition device for audio data acquisition and application to the client sends the incentive code for audio acquisition device identification code excited voice input; the application of the client. To determine the identity of the user according to the user's identity and the audio acquisition device the incentive codes and pre stored correspondence; the voice recognition device, the audio data into the text, and generate the speech recognition result contains the identity of the users according to the identity of the user specified. The invention realizes the accurate distinction of the role of the speaker in the sound stream, thereby realizing the identification result, showing the speech content in part, and greatly enhancing the legibility and usability of identifying the output text.

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别系统及方法
本专利技术涉及语音识别技术，具体的讲是一种语音识别系统及方法。
技术介绍
现有技术中，语音识别应用有两类，一类是基于个人终端(手机、个人电脑等)通过调用设备音频采集功能，提交云端语音识别服务器完成识别，识别结果返回终端；另一类是基于企事业单位内部的应用，声音数据来源为专用音视频编码设备，企业专用识别服务器通过网络获取音视频编码设备的音频数据实现识别，识别结果输出给专用记录软件终端。针对以上第二类应用，在所采集的声音数据为混音数据时，识别结果(即输出的文字内容)无法区分出说话人员的身份，导致识别文档的可读性差，可用性极低。如果采用每一个话筒单独编一路音频，以此来区分发言人身份的话，要增设专用设备，对现有硬件、布线等进行相应改造。
技术实现思路
为实现在完成语音识别生成文字的同时，对识别的文字内容区分讲话人角色，提高识别内容的可读性和可用性，本专利技术实施例提供了一种语音识别系统，系统包括：音频采集装置、应用客户端以及语音识别装置，其中，所述音频采集装置，用于采集音频数据并向应用客户端发送激励码，所述激励码用于标识有声音输入的音频采集装置；所述应用客户端，用于根据所述的激励码和预存储的用户身份与音频采集装置对应关系确定用户身份；所述语音识别装置，将所述的音频数据转换成文字内容，并根据确定的用户身份生成包含用户身份的语音识别结果。本专利技术实施例中，应用客户端包括：接收模块，用于接收所述的激励码；存储模块，用于预存储用户身份与音频采集装置对应关系；身份确定模块，用于根据接收到的激励码和预存储的用户身份与音频采集装置对应关系确定用户身份；发送模...
一种语音识别系统及方法

【技术保护点】
一种语音识别系统，其特征在于，所述的系统包括：音频采集装置、应用客户端以及语音识别装置，其中，所述音频采集装置，用于采集音频数据并向应用客户端发送激励码，所述激励码用于标识有声音输入的音频采集装置；所述应用客户端，用于根据所述的激励码和预存储的用户身份与音频采集装置对应关系确定用户身份；所述语音识别装置，将所述的音频数据转换成文字内容，并根据确定的用户身份生成包含用户身份的语音识别结果。

【技术特征摘要】
1.一种语音识别系统，其特征在于，所述的系统包括：音频采集装置、应用客户端以及语音识别装置，其中，所述音频采集装置，用于采集音频数据并向应用客户端发送激励码，所述激励码用于标识有声音输入的音频采集装置；所述应用客户端，用于根据所述的激励码和预存储的用户身份与音频采集装置对应关系确定用户身份；所述语音识别装置，将所述的音频数据转换成文字内容，并根据确定的用户身份生成包含用户身份的语音识别结果。2.如权利要求1所述的语音识别系统，其特征在于，所述的应用客户端包括：接收模块，用于接收所述的激励码；存储模块，用于预存储用户身份与音频采集装置对应关系；身份确定模块，用于根据接收到的激励码和预存储的用户身份与音频采集装置对应关系确定用户身份；发送模块，用于将确定的用户身份结果发送至所述语音识别装置。3.如权利要求2所述的语音识别系统，其特征在于，所述的应用客户端还包括：任务发起模块，获取所述的音频采集装置的音频流地址，并通过所述发送模块将包含音频流地址的任务发起请求发送到所述语音识别装置。4.如权利要求3所述的语音识别系统，其特征在于，所述的语音识别装置包括：接口模块，接收所述用户身份结果和任务发起请求；拉流模块...

【专利技术属性】
技术研发人员：王瑞宾，单衍景，
申请(专利权)人：北京华夏电通科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人