语音识别结果的检测方法、装置和介质制造方法及图纸

技术编号:32358148 阅读:35 留言:0更新日期:2022-02-20 03:21
本发明专利技术实施例提供了一种语音识别结果的检测方法、装置和介质,其中的方法具体包括:确定语音识别结果对应的文本特征;确定语音对应的韵律特征;根据所述文本特征和所述韵律特征,对所述语音识别结果进行检测,以得到所述语音识别结果对应的检测结果。本发明专利技术实施例能够检测语音识别结果中的不流畅问题。够检测语音识别结果中的不流畅问题。够检测语音识别结果中的不流畅问题。

【技术实现步骤摘要】
语音识别结果的检测方法、装置和介质


[0001]本专利技术实施例涉及语音处理
,特别是涉及一种语音识别结果的检测方法、装置和介质。

技术介绍

[0002]随着语音识别技术的不断发展,基于语音识别的应用也越来越广泛。语音识别技术已经渗透入家庭生活、办公领域、娱乐等应用场景。目前,用户可以通过例如个人计算机、笔记本电脑、平板电脑、专用的学习终端、智能手机的智能终端上外接或内置的麦克风来输入语音信号(例如,朗读一句话),经由语音识别引擎完成语音识别也即语音信号到文本的转换,并向用户提供对应的语音识别结果。
[0003]在实际应用中,用户的口头禅、结巴、修改重说等表达原因,使得语音识别结果中难免存在不流畅。

技术实现思路

[0004]如何检测语音识别结果中的不流畅问题,是本领域技术人员需要解决的技术问题。鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的语音识别结果的检测方法、装置和介质。
[0005]为了解决上述问题,本专利技术实施例公开了一种语音识别结果的检测方法,包括:
[0006]确定语音识别结果对应的文本特征;
[0007]确定语音对应的韵律特征;
[0008]根据所述文本特征和所述韵律特征,对所述语音识别结果进行检测,以得到所述语音识别结果对应的检测结果。
[0009]另一方面,本专利技术实施例公开了一种语音识别结果的检测装置,包括:
[0010]文本特征确定模块,用于确定语音识别结果对应的文本特征
[0011]韵律特征确定模块,用于确定语音对应的韵律特征;
[0012]检测模块,用于根据所述文本特征和所述韵律特征,对所述语音识别结果进行检测,以得到所述语音识别结果对应的检测结果。
[0013]再一方面,本专利技术实施例公开了一种用于检测语音识别结果的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,所述程序被一个或者一个以上处理器执行时,实现前述方法的步骤。
[0014]本专利技术实施例还公开了一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得装置执行前述的方法。
[0015]本专利技术实施例还公开了一种计算机程序产品,所述计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中,且适于由处理器读取并执行,以使得具有所述处理器的计算机设备执行前述的方法。
[0016]本专利技术实施例包括以下优点:
[0017]本专利技术实施例根据语音识别结果对应的文本特征、以及语音对应的韵律特征,对语音识别结果进行检测。上述文本特征能够反映语音识别结果在文本层面的特征,上述韵律特征能够反映语音识别结果在语音层面的特征;本专利技术实施例结合文本特征和韵律特征,对语音识别结果进行检测,能够检测语音识别结果中的不流畅问题。
附图说明
[0018]图1是本专利技术实施例的一种语音识别结果的检测方法的步骤流程图;
[0019]图2是本专利技术实施例的一种检测模型的训练方法的示意;
[0020]图3是本专利技术实施例的一种语音识别结果的检测方法的步骤流程图;
[0021]图4是本专利技术实施例的一种语音识别结果的检测装置的结构框图;
[0022]图5是本专利技术实施例的一种用于检测语音识别结果的装置1300的框图;
[0023]图6是本专利技术实施例的一种服务端的结构示意图。
具体实施方式
[0024]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。
[0025]针对如何检测语音识别结果中的不流畅问题的技术问题,本专利技术实施例提供了一种语音识别结果的检测方法,该方法具体包括:确定语音识别结果对应的文本特征;确定语音对应的韵律特征;以及,根据该文本特征和该韵律特征,对该语音识别结果进行检测,以得到语音识别结果对应的检测结果。
[0026]韵律特征,又叫超音质特征或者超音段特征,是指语音中除音质特征之外的音高、音长和音强方面的变化特征。该韵律特征包括但不限于:基音频率、发音持续时间、发音振幅和发音语速等。
[0027]本专利技术实施例根据语音识别结果对应的文本特征、以及语音对应的韵律特征,对语音识别结果进行检测。上述文本特征能够反映语音识别结果在文本层面的特征,上述韵律特征能够反映语音识别结果在语音层面的特征;本专利技术实施例结合文本特征和韵律特征,对语音识别结果进行检测,能够检测语音识别结果中的不流畅问题。
[0028]本专利技术实施例可以应用于语音识别场景。语音识别场景,可用于对用户输入的语音进行识别,以得到对应的语音识别结果。语音识别场景的例子可以包括:语音打字场景、语音对话场景、个人创作场景、访谈录音场景和语音记事场景等。
[0029]本专利技术实施例可以应用于语音识别引擎的下游,用于针对语音识别引擎输出的语音识别结果,检测其中的不流畅问题。可以根据上述检测结果,对语音识别结果进行修正,以提高语音识别结果的流畅性;进一步,可以将更流畅的语音识别结果输出给用户。
[0030]方法实施例一
[0031]参照图1,示出了本专利技术实施例的一种语音识别结果的检测方法的步骤流程图,该方法具体可以包括如下步骤:
[0032]步骤101、确定语音识别结果对应的文本特征;
[0033]步骤102、确定语音对应的韵律特征;
[0034]步骤103、根据该文本特征和该韵律特征,对该语音识别结果进行检测,以得到语
音识别结果对应的检测结果。
[0035]图1所示方法实施例可由服务端执行,可以理解,本专利技术实施例对于方法实施例的具体执行主体不加以限制。
[0036]在实际应用中,可以从上游(如语音识别引擎)接收语音及其对应的语音识别结果。语音与语音识别结果是相对应的关系,换言之,语音识别结果是对语音进行语音识别得到的文本结果。
[0037]语音识别是一个模型匹配的过程,在这个过程中,可以首先根据人的语音特点建立语音模型,通过对输入的语音的分析,抽取所需的特征,来建立语音识别所需的模板;对用户所输入的语音进行识别的过程即是将用户所输入语音的特征与所述模板比较的过程,最后确定与所述用户所输入语音匹配的最佳模板,从而获得语音识别的结果。具体的语音识别算法,可采用基于统计的隐含马尔可夫模型的训练和识别算法,也可采用基于神经网络的训练和识别算法、基于动态时间归整匹配的识别算法等等其他算法,本专利技术实施例对于具体的语音识别过程不加以限制。
[0038]步骤101中,文本特征能够反映语音识别结果在文本层面的特征。文本特征具体可以包括如下特征中的至少一种:文本表示、词间关系特征和词特征等。
[0039]其中,文本表示可用于表示文本的语义特征。确定语音识别结果对应的文本特征,具体可以包括:对语音识别结果对应文本进行切分,以得到对应的切分结果;根据语言模型,确定上述切分结果对应的文本表示。切分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别结果的检测方法,其特征在于,所述方法包括:确定语音识别结果对应的文本特征;确定语音对应的韵律特征;根据所述文本特征和所述韵律特征,对所述语音识别结果进行检测,以得到所述语音识别结果对应的检测结果。2.根据权利要求1所述的方法,其特征在于,所述确定语音识别结果对应的文本特征,包括:对所述语音识别结果对应文本进行切分,以得到对应的切分结果;根据语言模型,确定所述切分结果对应的文本表示。3.根据权利要求1所述的方法,其特征在于,所述确定语音识别结果对应的文本特征,包括:确定语音识别结果对应的词间关系特征和/或词特征。4.根据权利要求1至3中任一所述的方法,其特征在于,所述对所述语音识别结果进行检测,包括:将所述文本特征和所述韵律特征输入第一数据分析器,以得到所述第一数据分析器输出的检测结果;所述第一数据分析器用于表征输入数据与输出数据之间的映射关系,所述输入数据包括:文本特征和韵律特征,所述输出数据包括:检测结果。5.根据权利要求1至3中任一所述的方法,其特征在于,所述对所述语音识别结果进行检测,包括:根据神经网络,确定所述文本特征中词间关系特征和/或词特征与所述韵律特征对应的第一隐层状态特征;将所述第一隐层状态特征与所述文本特征中文本表示对应的第二隐层状态特征,作为第二数据分析器的输入,以得到所述第二数据分析器输出的检测结果;所述第二数据分析器用于表征输入数据与输出数据之间的映射关系,所述输入数据包括:第一隐层状态特征和第二隐层状态特征,所述输出数据包括:检测结果。6.根据权利要求1至3中任一所述的方法,其特征在于,所述检测结果包括:所述语音识别结果中字词对应的标签;所述标签包括:第一类别标签或第二类别标签。7.根据权利要求6所述的方法,其特征在于,所述第一类别标签用于表征字词存在不流畅问题;所述第一类别标签包括如下标签中的至少一种:语气词标签、口头禅标签、结巴词标签、以及识别错误标签。8.一种语音识别结果的检测装置,其特征在于,所述装置包括:文本特征确定模块,用于确定语音识别结果对应的文本特征;韵律特征确定模块,用于确定语音对应的韵律特征;检测模块,用于根据所述文本特征和所述韵...

【专利技术属性】
技术研发人员:林国雯占吉清
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1