基于语音识别的文本处理方法、装置、电子设备及介质制造方法及图纸

技术编号：29087360 阅读：14 留言：0更新日期：2021-06-30 09:52

本发明专利技术实施例公开了一种基于语音识别的文本处理方法、装置、电子设备及存储介质。所述方法包括：将语音识别获取的初始文本序列切分为至少两个切分对象，并确定至少两个切分对象中相邻两个切分对象之间的静音时长，进而依据各个相邻两个切分对象之间的静音时长，在至少两个切分对象中添加匹配的标点符号，得到带标点符号的目标文本序列。采用本申请技术方案，在对语音进行识别后可利用识别的文本中相邻单词或单字之间的静音时长，通过进行静音长度动态跟踪在各个单词或单字之间添加合适的标点符合，简单地使用语音识别器的静音信息就能实现快速标点符号断句的效果，增加文本识别结果的可读性，解决相关语音识别技术中无法自动添加标点符号，从而降低用户文本可读性的问题。题。题。

全部详细技术资料下载

【技术实现步骤摘要】
基于语音识别的文本处理方法、装置、电子设备及介质

[0001]本专利技术实施例涉及自然语言处理
，尤其涉及一种基于语音识别的文本处理方法、装置、电子设备及介质。

技术介绍

[0002]语音识别技术已经能够很好地进行字识别，但是语音识别结果并不直接包含标点符号信息，比如长句子和小段落识别的语音识别结果都是没有任何标点符号断句的文本结果。
[0003]标点符号后处理技术使用了语言相关的标点符号添加模型，通过对大量带标点符号的文本进行标点符号上下文信息建模，从而在识别结果出来后进行标点符号添加。但是，需要引入语言相关模块和大量训练语料以及相关建模专业知识，对于标点符号的精度和种类要求并不高的应用而言开发和维护成本较高。

技术实现思路

[0004]本专利技术实施例中提供了一种基于语音识别的文本处理方法、装置、电子设备及存储介质，以实现简单迅速地解决标点符号的断句问题。
[0005]第一方面，本专利技术实施例中提供了一种基于语音识别的文本处理方法，所述方法包括：
[0006]将语音识别获取的初始文本序列切分为至少两个切分对象；其中所述切分对象包括单词或单字；
[0007]确定所述至少两个切分对象中相邻两个切分对象之间的静音时长；
[0008]依据各个相邻两个切分对象之间的静音时长，在至少两个切分对象中添加匹配的标点符号，得到带标点符号的目标文本序列。
[0009]第二方面，本专利技术实施例中还提供了一种基于语音识别的文本处理装置，所述装置包括：
[0...

【技术保护点】

【技术特征摘要】
1.一种基于语音识别的文本处理方法，其特征在于，所述方法包括：将语音识别获取的初始文本序列切分为至少两个切分对象；其中所述切分对象包括单词或单字；确定所述至少两个切分对象中相邻两个切分对象之间的静音时长；依据各个相邻两个切分对象之间的静音时长，在至少两个切分对象中添加匹配的标点符号，得到带标点符号的目标文本序列。2.根据权利要求1所述的方法，其特征在于，确定所述至少两个切分对象中相邻两个切分对象之间的静音时长，包括：将所述至少两个切分对象中各个切分对象，顺序重组为相邻两个切分对象间存在候选静音片段识别的目标文本对齐语法；所述目标文本对齐语法指示的切分对象中头部切分对象前面与尾部切分对象后面分别添加必选静音片段识别；通过对目标文本对齐语法进行语法强制对齐，得到相邻两个切分对象之间的静音时长。3.根据权利要求2所述的方法，其特征在于，通过对目标文本对齐语法进行语法强制对齐，得到相邻两个切分对象之间的静音时长，包括：将所述目标文本对齐语法编译为基于语法的语法识别网络；解码器利用初始文本序列的原始语音，对基于语法的语法识别网络进行语法强制对齐解码得到所有候选静音片段的时间信息，并作为相邻两个切分对象之间的静音时长。4.根据权利要求1所述的方法，其特征在于，依据各个相邻两个切分对象之间的静音时长，在至少两个切分对象中添加匹配的标点符号，包括：依据各个相邻两个切分对象之间的静音时长，确定一当前静音时长平均值；依据相邻两个切分对象之间的静音时长和当前的静音时长阈值取值范围，确定在相邻两个切分对象之间添加匹配的标点符号；其中所述当前的静音时长阈值取值范围基于当前静音时长平均值与标点符号关联的放大系数确定。5.一种基于语音识别的文本处理装置，其特征在于，所述装置包括：文本切分模块，用于将语音识别获取的初始文本序列切分为至少两个切分对象；其中所述切分对象包括单词或单字；静音识别模块，用于确定所述...

【专利技术属性】
技术研发人员：王天哲，
申请(专利权)人：北京儒博科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人