一种语音识别中添加标点符号的方法及语音识别装置制造方法及图纸

技术编号：28782180 阅读：29 留言：0更新日期：2021-06-09 11:14

一种语音识别中添加标点符号的方法及语音识别装置。该方法包括：判别器判别并提取语音信号的语音特征，并获得语音数据流；语音解码器对所述语音数据流进行解码，并根据一个可搜索的状态空间以及所述语音特征确定第一符号；所述空间状态包括发音词典、声学模型和语言模型；所述发音词典包含单词及其该单词对应发音的集合；深度神经网络分类器根据上下文对所述第一符号做进一步判别，并输出标注第二符号的文本信息；其中，该深度神经网络分类器为预先训练的快速深度神经网络分类器。该方案可提升语音识别中标点符号添加的准确率。提升语音识别中标点符号添加的准确率。提升语音识别中标点符号添加的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别中添加标点符号的方法及语音识别装置

[0001]本专利技术涉及音频
，尤其涉及一种语音识别的

技术介绍

[0002]随着通信技术以及信息处理技术的长足发展与设备计算力的日渐充足，语音识别技术的应用也越来越广泛，如：同声翻译，语音转写，人机交互，语音控制等。
[0003]但，传统的语音识别技术中，仅针对实际文本内容与其对应的声音进行建模并分析识别语音内容，对于标点符号却难以同有声文本一样进行建模，因此往往对标签符号忽略不计。因此，传统的语音识别技术直接输出的结果通常为一长串字符或单词信息构成的文本。随着语音长度的增加，文本阅读难度也随之提升。因此，我们需要对语音识别系统的输出结果自动添加标点符号处理，提高易懂性和效率。

技术实现思路

[0004]本申请提供一种可在语音识别装置输出的文本信息中自动添加标点符号的一种语音识别中添加标点符号的方法及语音识别装置。
[0005]本申请提供以下技术方案：
[0006]一方面，提供一种语音识别中添加标点符号的方法，其包括：判别器判别并提取语音信号的语音特征，并获得语音数据流；语音解码器对所述语音数据流进行解码，并根据一个可搜索的状态空间以及所述语音特征确定第一符号；所述空间状态包括发音词典、声学模型和语言模型；所述发音词典包含单词及其该单词对应发音的集合；深度神经网络分类器根据上下文对所述第一符号做进一步判别，并输出标注第二符号的文本信息；其中，该深度神经网络分类器为预先训练的快速深度神经网络分类器。
[0...

【技术保护点】

【技术特征摘要】
1.一种语音识别中添加标点符号的方法，其特征在于，所述方法包括：判别器判别并提取语音信号的语音特征，并获得语音数据流；语音解码器对所述语音数据流进行解码，并根据一个可搜索的状态空间以及所述语音特征确定第一符号；所述空间状态包括发音词典、声学模型和语言模型；所述发音词典包含单词及其该单词对应发音的集合；深度神经网络分类器根据上下文对所述第一符号做进一步判别，并输出标注第二符号的文本信息；其中，该深度神经网络分类器为预先训练的快速深度神经网络分类器。2.如权利要求1所述的方法，其特征在于，所述语音特征包括无人声语音片段的时长、以及所述无人声语音片段的时间戳。3.如权利要求2所述的方法，其特征在于，所述判别器判别并提取语音信号的语音特征，包括接收所述语音信息后，利用人声识别技术确定无人声语音片段的时长；将所述时间戳的信息向量化加入根据该无人声语音片段的特征向量里，化为加权有限状态机进行计算。4.如权利要求2所述的方法，其特征在于，所述根据一个可搜索的状态空间以及所述语音特征确定第一符号，包括：根据所述无人声语音片段的时长确定所述无人声语音片段是标点符号还是无意义静音段；根据所述状态空间识别所述语音数据流中的初步符号；根据所述时间戳，确认所述初步符号中与所述无人声语音片段的标点符号对应的标点符号为所述第一符号。5.如权利要求1所述的方法，其特征在于，所述发音词典还包括以下三类静音词：第一静音词对应句中标点符号，第二静音词对应句尾标点符号，第三静音词对应无意义静音词；所述第一符号用于标注所述语音信息中的静音词。6.如权利要求1所述的方法，其特征在于，所述语言模型为预先训练的模型，通过以下训练方法获得：基于经过规范化处理的文本语料，统计出现频率最高的M个单词和N个目标识别范围内的标点符号；基于所述出现频率最高的所述M个单词和所述N个目标识别范围内的标点符号构造训练词汇表；M、N均为大于等于1的正整数；根据所述训练词汇表训练所述语言模型。7.如权利要求1所述的方法，其特征在于，所述深度神经网络分类器通过以下方法训练获得：对经过规范化处理的文本语料中的目标标点符号进行分类；将分类后的所述文本语料送入长短期记忆神经网络中进行上下文特征提取训练，获得判别模型。8.如权利要求1
‑
7中任意一项所述的方法，其特征在于，所述发音词典、所述声学模型的建模单元和所述语言模型的建模单元之间有映射关系。9.一种语音识别装置，其特征在于，所述语音识别装置包括：
判别器，用于判别并提取语音信号的语音特征，并获得语音数据流；语音解码器，用于对所述语音数据流进行解...

【专利技术属性】
技术研发人员：陈文明，尚天赐，邓高锋，张世明，吕周谨，
申请(专利权)人：虫洞创新平台深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人