语音信息的处理方法和装置制造方法及图纸

技术编号:24965274 阅读:36 留言:0更新日期:2020-07-21 15:09
本申请提出一种语音信息的处理方法和装置,其中方法包括:获取语音信息;确定语音信息的语意和语音信息中的第一语气词;根据语音信息的语意和第一语气词生成第二播报文本;播报第二播报文本,即实现了播报第二播报文本时与用户的情绪和心情相匹配,从而提高用户的体验,解决了现有技术中语音设备播报反馈的语音时语气单一,用户体验差的问题。

Processing method and device of voice information

【技术实现步骤摘要】
语音信息的处理方法和装置
本申请涉及语音播报领域,特别涉及语音信息的处理方法和装置。
技术介绍
在现有技术中,具有语音识别的装置在实际应用时,当接收到的语音信息后,会剔除其中无意义的语气词。但实际上语气词中包含了用户想要表达的潜在内容,例如用户的此时的情绪、性格、心里状态等。现有技术中对一些无意义语气词的忽略处理,播报反馈的语音信息时采用单一的语气进行播报,会致使用户使用体验效果差。因此,结合语音信息中的语气词对语音信息进行处理,以提高用户体验,是现有技术中亟待解决的问题。
技术实现思路
本申请提供了一种语音信息的处理方法和装置,用于结合语音信息中的语气词对语音信息进行处理,以提高用户体验。为了解决上述问题,作为本申请的一个方面,提供了一种语音信息的处理方法,包括:获取语音信息;确定语音信息的语意和语音信息中的第一语气词;根据语音信息的语意和第一语气词生成第二播报文本;播报第二播报文本。可选的,根据语音信息的语意和第一语气词生成第二播报文本,包括:根据语音信息的语意确定第一播报文本;根据第一语气词为第一播报文本增加第二语气词得到第二播报文本。可选的,根据语音信息的语意和第一语气词生成第二播报文本,包括:根据语音信息的语意确定第一播报文本;建立语气韵律模型,将语意、第一语气词和第一播报文本作为输入值,输出结果为带有第二语气词的第二播报文本。可选的,语气韵律模型为BP神经网络模型、卷积神经网络模型或者残差神经网络模型。可选的,播报第二播报文本,包括:根据第一语气词确定语音信息中的第一语气和/或第一语调;根据第一语气和/或第一语调确定播报第二播报文本时的第二语气和/或第二语调;采用第二语气和/或第二语调播报第二播报文本。本申请还提出一种语音信息的处理装置,包括:获取单元,用于获取语音信息;解析单元,用于确定语音信息的语意和语音信息中的第一语气词;文本生成单元,用于根据语音信息的语意和第一语气词生成第二播报文本;语音播报单元,用于播报第二播报文本。可选的,文本生成单元根据语音信息的语意和第一语气词生成第二播报文本,包括:根据语音信息的语意确定第一播报文本;根据第一语气词为第一播报文本增加第二语气词得到第二播报文本。可选的,文本生成单元根据语音信息的语意和第一语气词生成第二播报文本,包括:根据语音信息的语意确定第一播报文本;建立语气韵律模型,将语意、第一语气词和第一播报文本作为输入值,输出结果为带有第二语气词的第二播报文本。可选的,语气韵律模型为BP神经网络模型、卷积神经网络模型或者残差神经网络模型。可选的,语音播报单元播报第二播报文本,包括:根据第一语气词确定语音信息中的第一语气和/或第一语调;根据第一语气和/或第一语调确定播报第二播报文本时的第二语气和/或第二语调;采用第二语气和/或第二语调播报第二播报文本。本申请提出了一种语音信息的处理方法和装置,在对语音信息进行处理时,结合语音信息中的第一语气词生成第二播报文本,第一语气词表征了用户的情绪和状态,因此本申请中第二播报文本所表达的语气与用户的情绪和状态相匹配,即实现了播报第二播报文本时与用户的情绪和心情相匹配,从而提高用户的体验,解决了现有技术中语音设备播报反馈的语音时语气单一,用户体验差的问题。附图说明图1为本申请实施例中一种语音信息的处理方法流程图;图2为本申请实施例中一种语音信息的处理装置的组成图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或电器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或电器固有的其它步骤或单元。在现有技术中,当用户发出语音信息后,发出的语音信息中可能包含有语气词,这些语气词通常会被接收到语音信息的语音识别设备忽略,而事实上,语气词表明了用户此时的情绪和状态,现有技术中在根据用户的语音信息进行反馈时没有考虑到语气词所表征的用户的情绪和状态,因此在根据语音信息确定了播报文本进行播报时,播报文本的内容没有结合用户发出的语音信息中的语气词进行调整,造成用户体验低。为了解决上述技术问题,提高用户的使用体验,如图1所示,本申请提出了一种语音信息的处理方法,包括:S11:获取语音信息。具体的,语音信息是由用户发出的语音,在本申请中可以通过麦克风阵列接收用户发出的语音信息,语音信息中包括用户发出的指令,该指令可以是用于控制任何设备,也可以是用于查询任何内容。S12:确定语音信息的语意和语音信息中的第一语气词。具体的,第一语气词是用户发出的语音信息中包含的语气词,语气词是表示语气的虚词,常用在句尾或句中停顿处表示种种语气。常见的语气词有:的、了、么、呢、吧、啊。语气词通常附着在词语、句子末,表示语气。语音信息的语意是指其包含的具体意思。例如用户发出达到语音信息为“帮我打开一下空调吧,快点哦”,则其中的语意为“打开空调,快点”,其中包含的语气词为“吧”和“哦”。S13:根据语音信息的语意和第一语气词生成第二播报文本;S14:播报第二播报文本。具体的,在本申请中,由语意可以确定用户的意图,从而执行相应的操作,例如用户要求打开空调则打开空调,第二播报文本是对用户发出的语音信息的反馈,例如根据语音信息打开了空调后,而第一语义词的作用主要在于调节播放第二播报文本时的语气和语调,具体可以在第二播报文本中增加对应的语气词从而调节播放第二播报文本时的语气和语调。例如用户发出的语音信息中的第一语气词包含了“哈”、“嘻嘻”和“哦”等词语,从而确定此时用户心情较好,情绪高涨,则播放第二播报文本时采用相同类型的“呢”、“哦哦”、“嘻嘻”等表示轻快,高昂的语气词加入第二播报文本。而当用户发出的语音信息中的第一语气词包含“哎”、“嗯”、“罢了”、“算了”、“呃”、“欸”等词,表明此时用户心情较为低落,则播报第二播报文本时应当采用“呢”、“吗”、“好的”等表示舒缓平和的语气词播报第二播报文本。例如用户发出的语音信息为“帮我打本文档来自技高网...

【技术保护点】
1.一种语音信息的处理方法,其特征在于,包括:/n获取语音信息;/n确定所述语音信息的语意和所述语音信息中的第一语气词;/n根据所述语音信息的语意和第一语气词生成第二播报文本;/n播报所述第二播报文本。/n

【技术特征摘要】
1.一种语音信息的处理方法,其特征在于,包括:
获取语音信息;
确定所述语音信息的语意和所述语音信息中的第一语气词;
根据所述语音信息的语意和第一语气词生成第二播报文本;
播报所述第二播报文本。


2.根据权利要求1所述的语音信息的处理方法,其特征在于,根据所述语音信息的语意和第一语气词生成第二播报文本,包括:
根据所述语音信息的语意确定第一播报文本;
根据所述第一语气词为所述第一播报文本增加第二语气词得到第二播报文本。


3.根据权利要求1所述的语音信息的处理方法,其特征在于,根据所述语音信息的语意和第一语气词生成第二播报文本,包括:
根据所述语音信息的语意确定第一播报文本;
建立语气韵律模型,将所述语意、第一语气词和第一播报文本作为输入值,输出结果为带有第二语气词的第二播报文本。


4.根据权利要求3所述的语音信息的处理方法,其特征在于,所述语气韵律模型为BP神经网络模型、卷积神经网络模型或者残差神经网络模型。


5.根据权利要求1-4任一项所述的语音信息的处理方法,其特征在于,播报所述第二播报文本,包括:
根据所述第一语气词确定所述语音信息中的第一语气和/或第一语调;
根据所述第一语气和/或第一语调确定播报所述第二播报文本时的第二语气和/或第二语调;
采用所述第二语气和/或第二语调播报所述第二播报文本。


6.一种语音信息的处理装置,其特征在于,包括...

【专利技术属性】
技术研发人员:刘健军王慧君张新
申请(专利权)人:珠海格力电器股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1