基于铁路调度单声道语音识别方法及系统技术方案

技术编号：32648363 阅读：30 留言：0更新日期：2022-03-12 18:35

本发明专利技术属于铁路调度业务处理技术领域，特别涉及一种基于铁路调度单声道语音识别方法及系统，构建铁路调度人员声纹特征库并存储每个调度人员声纹特征；收集调度台与车站之间的调度指令录音数据，并对调度指令录音数据进行录音片段切割和分组规整，形成语音片段数据集一，且在每个录音片段均对应设置有ID；针对每个录音片段，将发声人员身份与声纹特征库中每个调度员身份进行关联，形成包含调度员身份信息的语音片段数据集二，通过文字转写形成包含对应录音片段转写文字信息的数据集三；根据上述两个数据集三合并获取语音片段数据集四，以实现铁路调度指令语音的听看识别，便于对铁路调度业务中调度员的监管，提升铁路运输服务质量及国民满意度。量及国民满意度。量及国民满意度。

全部详细技术资料下载

【技术实现步骤摘要】
基于铁路调度单声道语音识别方法及系统

[0001]本专利技术属于铁路调度业务处理
，特别涉及一种基于铁路调度单声道语音识别方法及系统。

技术介绍

[0002]调度所是铁路日常运输组织的指挥中枢。调度员口头指示非常严肃，直接关系到运输生产效率与调度指挥安全，且有明确规定“指挥列车运行的命令(运行揭示调度命令除外)和口头指示，只能由列车调度员发布”，因此调度用语的标准化执行与检查工作就显得尤为重要。目前全国18个铁路局调度所使用的通信及录音设备已建设多年，如北京局调度所通信及录音系统建于2010年，已使用10年之久。铁路调度通信及录音设备陈旧老化、功能单一落后，调度语音数据量庞大，语音质量差，目前全路范围内对调度语音的检查工作，仍停留在通过人工回放、人耳分辨形式进行，反应滞后、效率低下，无法满足对全量调度语音进行快捷有效检查分析的需求。急需通过语音识别手段进行录音中调度员身份的自动确定及语音到文字的自动转写，便于后续的分析。经调研，全国多数铁路局调度的录音为单声道8k8bit，1:2压缩存储，信噪比较低，存在强噪声、强干扰...

【技术保护点】

【技术特征摘要】
1.一种基于铁路调度单声道语音识别方法，其特征在于，包含如下内容：构建铁路调度人员声纹特征库并存储每个调度人员声纹特征；收集调度台与车站之间的调度指令录音数据，并对调度指令录音数据进行录音片段切割和分组规整，形成原始的语音片段数据集一，且在该语音片段数据集一中每个录音片段均对应设置有ID；针对语音片段数据集一中每个录音片段，将每个录音片段中发声人员身份与声纹特征库中每个调度员身份进行关联，形成包含调度员身份信息的语音片段数据集二；并通过对每个录音片段进行文字转写，形成包含对应录音片段转写文字信息的数据集三；根据语音片段数据集二和数据集三，通过合并规整出来来获取包含发声人员身份及文字内容的语音片段数据集四；依据语音片段数据集四获取调度指令录音中每个语音片段调度员身份及语音片段对应文字并进行输出，以实现铁路调度业务中调度指令语音的听看识别。2.根据权利要求1所述的基于铁路调度单声道语音识别方法，其特征在于，针对收集到的收集调度台与车站之间的调度指令录音数据，首先对调度指令语音数据进行预处理，然后再进行录音片段切割，其中，预处理至少包含：对录音数据中噪声抑制处理的语音降噪处理及对录音数据中人声语音增强的信号增强处理。3.根据权利要求1或2所述的基于铁路调度单声道语音识别方法，其特征在于，对调度指令录音数据进行录音片段切割中，利用人声分离算法对调度指令录音数据进行人声分离，确定发声人员个数及每个发声人员录音片段发声的起止时间段及不同时间段发声人员归属；并依据不同时间段对并行语音片段进行分组规整，形成以数组形式存储的语音片段数据集一。4.根据权利要求1所述的基于铁路调度单声道语音识别方法，其特征在于，针对语音片段数据集一，以发声人员为依据，利用声纹识别算法提取语音片段中发声人员的声纹特征，将提取到的声纹特征与铁路调度人员声纹特征库中每个调度员的声纹特征进行比对，将每个录音片段中发声人员身份与声纹特征库中每个调度员身份进行关联，确定每个录音片段中发声人员身份信息并进行标记，形成包含调度员身份信息的语音片段数据集二。5.根据权利要求1或4所述的基于铁路调度单声道语音识别方法，其特征在于，语音片段数据集二...

【专利技术属性】
技术研发人员：杨绪魁，屈丹，何振华，闫红刚，张文林，陈琦，李喜坤，
申请(专利权)人：郑州信大先进技术研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人