一种语音媒体处理用语音转文字识别系统技术方案

技术编号：35596898 阅读：12 留言：0更新日期：2022-11-16 15:16

本发明专利技术公开了一种语音媒体处理用语音转文字识别系统，语音输入模块，其与外部终端连接，用于将外部终端语音媒体内的需要转文字的语音数据进行输入；语音转化模块，其与语音输入模块连接，用于将已经输入的语音数据进行拼音转化，并通过搜索词库，将拼音组成文字语句。本发明专利技术通过在语音转文字识别系统中添设置语音转化模块与场景判断模块，并通过词库存储模块的配合，自动将语音拼音化处理，然后根据相似度选择词汇，并根据训练场景的自动匹配，对转化的词汇进行纠错处理，替换合理词汇，从而达到快速语音转文字的效果，同时还对无法匹配场景的语音进行备份，进行新场景训练，丰富历史场景，为后续的语音转化提供场景基础。为后续的语音转化提供场景基础。为后续的语音转化提供场景基础。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音媒体处理用语音转文字识别系统

[0001]本专利技术涉及语音识别
，具体为一种语音媒体处理用语音转文字识别系统。

技术介绍

[0002]语音识别是一门交叉学科。近二十年来，语音识别技术取得显著进步，开始从实验室走向市场。人们预计，未来10年内，语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。现有的语音媒体在进行语音转文字识别时，直接对比文字库进行语音识别筛选词汇，效率较快，但是准确度缺乏保证，无法通过预设场景对语音进行匹配，导致文字识别出的词汇差别较多，意思相差较大。

技术实现思路

[0003]本专利技术的目的在于提供一种语音媒体处理用语音转文字识别系统，以解决上述
技术介绍
中提出的问题。
[0004]为实现上述目的，本专利技术提供如下技术方案：一种语音媒体处理用语音转文字识别系统，包括：
[0005]语音输入模块，其与外部终端连接，用于将外部终端语音媒体内的需要转文字的语音数据进行输入；
[0006]语音转化模块，其与语音输入模块连接，用于将已经输入的语音数据进行拼音转化，并通过搜索词库，将拼音组成文字语句；
[0007]词库存储模块，其与语音转化模块连接，用于储存文字词汇；
[0008]场景判断模块，其与语音转化模块连接，用于进行场景训练，并对比已经转化的文字语句，判断文字是否需要纠错，然后根据场景填充符号；
[0009]文字输出模块，其与场景判断模块和外部终端连接，用于将已经填充好符号的文字语句输出...

【技术保护点】

【技术特征摘要】
1.一种语音媒体处理用语音转文字识别系统，其特征在于，包括：语音输入模块，其与外部终端连接，用于将外部终端语音媒体内的需要转文字的语音数据进行输入；语音转化模块，其与语音输入模块连接，用于将已经输入的语音数据进行拼音转化，并通过搜索词库，将拼音组成文字语句；词库存储模块，其与语音转化模块连接，用于储存文字词汇；场景判断模块，其与语音转化模块连接，用于进行场景训练，并对比已经转化的文字语句，判断文字是否需要纠错，然后根据场景填充符号；文字输出模块，其与场景判断模块和外部终端连接，用于将已经填充好符号的文字语句输出至外部终端语音媒体中。2.根据权利要求1所述的语音媒体处理用语音转文字识别系统，其特征在于，所述语音转化模块包括音节分离单元、词库对接单元、字符拼接单元和停顿处理单元；所述音节分离单元用于接收语音数据，并将语音数据根据音节进行拆分，并转化成拼音；所述词库对接单元分别与音节分离单元、词库存储模块以及场景判断模块连接，用于将已经转化的拼音在词库中搜索，挑选同音的文字及词汇；所述字符拼接单元分别与词库对接单元以及场景判断模块连接，用于与与历史场景对比，辅助词库对接单元挑选出符合当前场景的文字及词汇，并将其拼接为完整的语句；所述停顿处理单元与字符拼接单元连接，用于将已经拼接完整的语句根据当前场景以及语音数据原有停顿进行处理，预留符号位。3.根据权利要求2所述的语音媒体处理用语音转文字识别系统，其特征在于，所述词库对接单元在搜索词库时，优先搜索拼音相符的文字和...

【专利技术属性】
技术研发人员：史琦，沈林啸，马凯，
申请(专利权)人：启迪万众网络科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人