语气识别方法、装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号:18085509 阅读:80 留言:0更新日期:2018-05-31 14:01
本发明专利技术公开了一种语气识别方法、装置、电子设备和计算机可读存储介质。其中方法包括:获取样本文本;获取针对样本文本的多个录音数据,其中,多个录音数据是通过使用多种类别语气朗读样本文本而得到的语音;提取多个录音数据中的语气特征,并确定语气特征对应的语气类别;根据样本文本、多个录音数据中的语气特征和对应的语气类别,建立语气识别模型。该方法可以使得每个样本文本被标注各种类别语气特征和对应的语气类别,以便在线上应用中,在对用户输入的语音数据进行语音识别的同时,还可以通过预先建立的语气识别模型对该语音数据进行语气识别,实现了针对语音数据中各种类别语气的识别,提高了语音识别效果。

【技术实现步骤摘要】
语气识别方法、装置、电子设备和计算机可读存储介质
本专利技术涉及语音识别
,尤其涉及一种语气识别方法、装置、电子设备和计算机可读存储介质。
技术介绍
目前有的语音文本相同,但由于用户讲该语音文本时使用了不同的语气,则导致用户的意图大大不同,例如,以文本“真的”为例,用户可以使用肯定语气讲该文本,还可以使用反问语气讲该文本,由于用户使用了两个不同的语气,所以用户的意图也会不同。然而,传统的语音识别技术,仅能对用户的语音内容进行识别,而还不能识别出用户语音的疑问语气,使得语音识别效果差,从而导致人机语音之间的对话效果差。
技术实现思路
本专利技术的目的旨在至少在一定程度上解决上述的技术问题之一。为此,本专利技术的第一个目的在于提出一种语气识别方法。该方法可以使得每个样本文本被标注各种类别语气特征和对应的语气类别,以便在线上应用中,在对用户输入的语音数据进行语音识别的同时,还可以通过预先建立的语气识别模型对该语音数据进行语气识别,实现了针对语音数据中各种类别语气的识别,提高了语音识别效果。本专利技术的第二个目的在于提出一种语气识别装置。本专利技术的第三个目的在于提出一种电子设备。本专利技术的第四个目的在于提出一种计算机可读存储介质。为达到上述目的,本专利技术第一方面实施例提出的语气识别方法,包括:获取样本文本;获取针对所述样本文本的多个录音数据,其中,所述多个录音数据是通过使用多种类别语气朗读所述样本文本而得到的语音;提取所述多个录音数据中的语气特征,并确定所述语气特征对应的语气类别;根据所述样本文本、所述多个录音数据中的语气特征和对应的语气类别,建立语气识别模型。本专利技术实施例的语气识别方法,可通过使用多种类别语气朗读样本文本以得到多个录音数据,并提取该录音数据中的语气特征,并确定该语气特征对应的语气类别,最后根据该样本文本、录音数据中的语气特征和对应的语气类别,建立语气识别模型,使得每个样本文本被标注了各种类别语气特征和对应的语气类别,以便在线上应用中,在对用户输入的语音数据进行语音识别的同时,还可以通过预先建立的语气识别模型对该语音数据进行语气识别,实现了针对语音数据中各种类别语气的识别,提高了语音识别效果,从而可以提高人机语音之间的对话效果,提升了用户体验。为达到上述目的,本专利技术第二方面实施例提出的语气识别装置,包括:第一获取模块,用于获取样本文本;第二获取模块,用于获取针对所述样本文本的多个录音数据,其中,所述多个录音数据是通过使用多种类别语气朗读所述样本文本而得到的语音;特征提取模块,用于提取所述多个录音数据中的语气特征;确定模块,用于确定所述语气特征对应的语气类别;模型建立模块,用于根据所述样本文本、所述多个录音数据中的语气特征和对应的语气类别,建立语气识别模型。本专利技术实施例的语气识别装置,可通过使用多种类别语气朗读样本文本以得到多个录音数据,并提取该录音数据中的语气特征,并确定该语气特征对应的语气类别,最后根据该样本文本、录音数据中的语气特征和对应的语气类别,建立语气识别模型,使得每个样本文本被标注了各种类别语气特征和对应的语气类别,以便在线上应用中,在对用户输入的语音数据进行语音识别的同时,还可以通过预先建立的语气识别模型对该语音数据进行语气识别,实现了针对语音数据中各种类别语气的识别,提高了语音识别效果,从而可以提高人机语音之间的对话效果,提升了用户体验。为达到上述目的,本专利技术第三方面实施例提出的电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时,实现本专利技术第一方面实施例所述的语气识别方法。为达到上述目的,本专利技术第四方面实施例提出的非临时性计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本专利技术第一方面实施例所述的语气识别方法。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,图1是根据本专利技术一个实施例的语气识别方法的流程图;图2是根据本专利技术一个具体实施例的语气识别方法的流程图;图3是根据本专利技术实施例的语气识别方法的流程示例图;图4是根据本专利技术一个实施例的语气识别装置的结构示意图;图5是根据本专利技术一个具体实施例的语气识别装置的结构示意图;图6是根据本专利技术另一个具体实施例的语气识别装置的结构示意图;图7是根据本专利技术又一个具体实施例的语气识别装置的结构示意图;图8是根据本专利技术一个实施例的电子设备的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的语气识别方法、装置、电子设备和计算机可读存储介质。图1是根据本专利技术一个实施例的语气识别方法的流程图。需要说明的是,本专利技术实施例的语气识别方法可应用于本专利技术实施例的语气识别装置,该语气识别装置可被配置于电子设备。其中,该电子设备可以是具有语音识别系统的设备,能够实现语音识别的功能。如图1所示,该语气识别方法可以包括:S110,获取样本文本。可选地,在建立语气识别模型之前,先收集大量的样本文本。其中,在本专利技术的实施例中,该样本文本可理解为利用不同语气来朗读时会对应不同的含义的文本,例如,文本“真的”、“你吃饭了”、“今天天气好吗”等。S120,获取针对样本文本的多个录音数据,其中,多个录音数据是通过使用多种类别语气朗读样本文本而得到的语音。作为一种示例,该多种类别语气可包括但不限于肯定语气、疑问语气和反问语气等。可选地,在得到样本文本之后,针对每个样本文本,可获取样本用户通过使用各种类别语气朗读该样本文本的录音数据。例如,以样本文本“真的”为例,可获取样本用户通过使用“肯定语气”朗读该样本文本“真的”,还可获取样本用户通过使用“疑问语气”朗读该样本文本“真的”。又如,以样本文本“今天天气好吗”为例,可获取样本用户通过使用“疑问语气”朗读该样本文本,还可获取样本用户通过使用“反问语气”朗读该样本文本。在得到针对各个样本文本的朗读语音时,可将该朗读语音作为针对该样本文本的录音数据。S130,提取多个录音数据中的语气特征,并确定语气特征对应的语气类别。可选地,在得到针对样本文本的多个录音数据之后,可提取各个录音数据中的语气特征,并确定该语气特征所对应的语气类别。其中,在本专利技术的实施例中,该语气类别可包括但不限于肯定类语气、疑问类语气和反问类语气等。需要说明的是,使用不同类别的语气朗读出来的样本文本的录音中所包含的语气会各不相同,则所对应的语义含义也会不同。表示语气的词通常是在句尾或句中停顿处表示种种语气。作为一种示例,可提取录音数据中句中停顿处、句尾处表示语气的音频,并提取该音频的特征,例如,该特征可以包含语调(如升调、降调、升降调、降升调、平调)等。S140,根据所述样本文本、所述多个录音数据中的语气特征和对应的语气类别,建立语气识别模型。可选地,可通过各个录音数据中的语气特征和对应的语气类别对该样本文本进行标注,并将该标注本文档来自技高网...
语气识别方法、装置、电子设备和计算机可读存储介质

【技术保护点】
一种语气识别方法,其特征在于,包括以下步骤:获取样本文本;获取针对所述样本文本的多个录音数据,其中,所述多个录音数据是通过使用多种类别语气朗读所述样本文本而得到的语音;提取所述多个录音数据中的语气特征,并确定所述语气特征对应的语气类别;根据所述样本文本、所述多个录音数据中的语气特征和对应的语气类别,建立语气识别模型。

【技术特征摘要】
1.一种语气识别方法,其特征在于,包括以下步骤:获取样本文本;获取针对所述样本文本的多个录音数据,其中,所述多个录音数据是通过使用多种类别语气朗读所述样本文本而得到的语音;提取所述多个录音数据中的语气特征,并确定所述语气特征对应的语气类别;根据所述样本文本、所述多个录音数据中的语气特征和对应的语气类别,建立语气识别模型。2.如权利要求1所述的语气识别方法,其特征在于,所述多种类别语气包括肯定语气、疑问语气和反问语气。3.如权利要求1或2所述的语气识别方法,其特征在于,所述方法还包括:接收用户的语音数据;对所述语音数据进行语音识别以得到对应的文本信息;通过所述语气识别模型对所述语音数据进行语气识别以获得对应的语气含义;根据所述文本信息和对应的语气含义给用户相应的响应。4.如权利要求3所述的语气识别方法,其特征在于,所述通过语气识别模型对所述语音数据进行语气识别以获得对应的语气含义,包括:通过所述语气识别模型对所述语音数据进行语气识别,以得到所述语音数据对应的语气类别;根据所述语气类别确定对应的语气含义。5.如权利要求3所述的语气识别方法,其特征在于,所述根据文本信息和对应的语气含义给用户相应的响应,包括:根据所述文本信息和对应的语气含义确定所述用户的用户意图;根据所述用户意图获取对应的对话内容,并将所述对应的对话内容提供给所述用户。6.一种语气识别装置,其特征在于,包括:第一获取模块,用于获取样本文本;第二获取模块,用于获取针对所述样本文本的多个录音数据,其中,所述多个录音数据是通过使用多种类别语气朗读所述样本文本而得到的语音;特征提取模块,用...

【专利技术属性】
技术研发人员:谢波
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1