语音识别结果的检测方法、装置和介质制造方法及图纸

技术编号：32358148 阅读：35 留言：0更新日期：2022-02-20 03:21

本发明专利技术实施例提供了一种语音识别结果的检测方法、装置和介质，其中的方法具体包括：确定语音识别结果对应的文本特征；确定语音对应的韵律特征；根据所述文本特征和所述韵律特征，对所述语音识别结果进行检测，以得到所述语音识别结果对应的检测结果。本发明专利技术实施例能够检测语音识别结果中的不流畅问题。够检测语音识别结果中的不流畅问题。够检测语音识别结果中的不流畅问题。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别结果的检测方法、装置和介质

[0001]本专利技术实施例涉及语音处理
，特别是涉及一种语音识别结果的检测方法、装置和介质。

技术介绍

[0002]随着语音识别技术的不断发展，基于语音识别的应用也越来越广泛。语音识别技术已经渗透入家庭生活、办公领域、娱乐等应用场景。目前，用户可以通过例如个人计算机、笔记本电脑、平板电脑、专用的学习终端、智能手机的智能终端上外接或内置的麦克风来输入语音信号(例如，朗读一句话)，经由语音识别引擎完成语音识别也即语音信号到文本的转换，并向用户提供对应的语音识别结果。
[0003]在实际应用中，用户的口头禅、结巴、修改重说等表达原因，使得语音识别结果中难免存在不流畅。

技术实现思路

[0004]如何检测语音识别结果中的不流畅问题，是本领域技术人员需要解决的技术问题。鉴于上述问题，提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的语音识别结果的检测方法、装置和介质。
[0005]为了解决上述问题，本专利技术实施例公开了一种语音识别结果的检测方法，包括：
[0006]确定语音识别结果对应的文本特征；
[0007]确定语音对应的韵律特征；
[0008]根据所述文本特征和所述韵律特征，对所述语音识别结果进行检测，以得到所述语音识别结果对应的检测结果。
[0009]另一方面，本专利技术实施例公开了一种语音识别结果的检测装置，包括：
[0010]文本特征确定模块，用于确定语音识别结果对应的文本特征...

【技术保护点】

【技术特征摘要】
1.一种语音识别结果的检测方法，其特征在于，所述方法包括：确定语音识别结果对应的文本特征；确定语音对应的韵律特征；根据所述文本特征和所述韵律特征，对所述语音识别结果进行检测，以得到所述语音识别结果对应的检测结果。2.根据权利要求1所述的方法，其特征在于，所述确定语音识别结果对应的文本特征，包括：对所述语音识别结果对应文本进行切分，以得到对应的切分结果；根据语言模型，确定所述切分结果对应的文本表示。3.根据权利要求1所述的方法，其特征在于，所述确定语音识别结果对应的文本特征，包括：确定语音识别结果对应的词间关系特征和/或词特征。4.根据权利要求1至3中任一所述的方法，其特征在于，所述对所述语音识别结果进行检测，包括：将所述文本特征和所述韵律特征输入第一数据分析器，以得到所述第一数据分析器输出的检测结果；所述第一数据分析器用于表征输入数据与输出数据之间的映射关系，所述输入数据包括：文本特征和韵律特征，所述输出数据包括：检测结果。5.根据权利要求1至3中任一所述的方法，其特征在于，所述对所述语音识别结果进行检测，包括：根据神经网络，确定所述文本特征中词间关系特征和/或词特征与所述韵律特征对应的第一隐层状态特征；将所述第一隐层状态特征与所述文本特征中文本表示对应的第二隐层状态特征，作为第二数据分析器的输入，以得到所述第二数据分析器输出的检测结果；所述第二数据分析器用于表征输入数据与输出数据之间的映射关系，所述输入数据包括：第一隐层状态特征和第二隐层状态特征，所述输出数据包括：检测结果。6.根据权利要求1至3中任一所述的方法，其特征在于，所述检测结果包括：所述语音识别结果中字词对应的标签；所述标签包括：第一类别标签或第二类别标签。7.根据权利要求6所述的方法，其特征在于，所述第一类别标签用于表征字词存在不流畅问题；所述第一类别标签包括如下标签中的至少一种：语气词标签、口头禅标签、结巴词标签、以及识别错误标签。8.一种语音识别结果的检测装置，其特征在于，所述装置包括：文本特征确定模块，用于确定语音识别结果对应的文本特征；韵律特征确定模块，用于确定语音对应的韵律特征；检测模块，用于根据所述文本特征和所述韵...

【专利技术属性】
技术研发人员：林国雯，占吉清，
申请(专利权)人：北京搜狗科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人