The present invention provides a speech recognition method of data preprocessing, including standard audio file organization module, standard text editing module, pronunciation dictionary configuration module, speech model generation module, data processing module identification standard sound feature. Saving the final generation of standard sound data model to the file system, directly in the application of pre generated data loading model identification of user score recording, solved in the practical application of the standard tone recognition efficiency of user identification and recording of the problem of low.
【技术实现步骤摘要】
一种语音识别数据预处理方法
本专利技术涉及语音识别领域,尤其涉及一种语音识别数据预处理方法。
技术介绍
语音识别技术已广泛应用于手机,pc等用户终端中.如:输入法,语言学习系统,搜索系统产品.绝大部份语音识别应用产品在语音识别技术应用中都是采用用户终端采集用户录音数据,发送到后台服务器进行识别模式.例如公开号为CN103137129A的一种语音识别方法及电子装置,其通过电子装置的用户使用情况收集用户特定信息,记录用户的发言,使远程服务器产生记录的发言的远程语音识别结果等等,这种模式的缺点是后台识别系统需要有强大性能的硬件系统支撑,搭建成本高,动辄上亿才能基本满足大用户量访问需求.而且用户必须在网络连接状态下使用语音识别应用产品.如果能够把用户终端机器计算能力利用起来,就能极大的减少硬件成本.但用户终端计算能力一般没有服务器系统强,因此需要一种优化在用户终端进行语音识别计算的处理,提高识别效率的方法。
技术实现思路
本专利技术的目的是提供一种能够优化利用用户终端计算能力进行语音识别评分效率而进行的处理语音识别数据方法。具体技术方案包含如下步骤:步骤1)组织标准音频文件,整理需要生成数据模型的音频文件;步骤2)编辑标准文本,整理编辑需要识别评分的文段,句子,单词等文本;步骤3)配置发音词典,配置该文段需要用到的通用发音词典或者特殊发音词典;步骤4)生成对应语音模型,根据以上步骤产出文件来生成对应语音模型,保存语音模型文件;步骤5)采用生成的语音模型调用语音识别引擎进行对标准音特征数据进行识别处理,生成并保存标准音数据模型;步骤6)采用预生成数据模型在应用产品中直接 ...
【技术保护点】
一种语音识别数据预处理方法,其特征在于,包括以下步骤:步骤1)组织标准音频文件,整理需要生成数据模型的音频文件;步骤2)编辑标准文本,整理编辑需要识别评分的文段,句子,单词等文本;步骤3)配置发音词典,配置该文段需要用到的通用发音词典或者特殊发音词典;步骤4)生成对应语音模型,根据以上步骤产出文件来生成对应语音模型,保存语音模型文件;步骤5)采用生成的语音模型调用语音识别引擎进行对标准音特征数据进行识别处理,生成并保存标准音数据模型;步骤6)采用预生成数据模型在应用产品中直接加载预生成数据模型进行对用户录音进行识别评分。
【技术特征摘要】
1.一种语音识别数据预处理方法,其特征在于,包括以下步骤:步骤1)组织标准音频文件,整理需要生成数据模型的音频文件;步骤2)编辑标准文本,整理编辑需要识别评分的文段,句子,单词等文本;步骤3)配置发音词典,配置该文段需要用到的通用发音词典或者特殊发音词典;步骤4)生成对应语音模型,根据以上步骤产出文件来生成对应语音模型,保存语音模型文件;步骤5)采用生成的语音模型调用语音识别引擎进行对标准音特征数据进行识别处理,生成并保存标准音数据模型;步骤6)采用预生成数据模型在应用产品中直接加载预生成数据模型进行对用户录音进行识别评分。2.根据权利要求1所述的一种语音识别数据预处理方法,其特征在于:所述步骤1)中整理编辑文本的步骤如下:11)由于用户终端CPU计算能力限制,进行语音识别评分需要把识别目标设定在一定范围内.如设定为一个单元的课文内容。3.根据权利要求1所述的一种语音识别数据预处理方法,其特征在于:所述步骤2)中整理编辑文本的步骤如下:创建一个XML配置文件,给每个句子或者单词都在配置文件中创建一个节点,节点中包含音频文件引用路径和对应文本。4.根据权利要求1所述的一种语音识别数据预处理方法,其特征在于:所述步骤3)中配置发音词典的步骤如下:31)完成单词或句子配置后,针对每个单词的节点对应配置发音词典...
【专利技术属性】
技术研发人员:朱崇俊,
申请(专利权)人:广东东田数码科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。