语音识别处理及反馈系统、语音回复方法技术方案

技术编号:9008247 阅读:241 留言:0更新日期:2013-08-08 03:07
本发明专利技术提供一种语音识别处理及反馈系统、语音回复方法,该方法包括:采集用户的语音信息;对用户的语音信息进行识别,将识别出的语音信息转化为文字信息;生成对应于文字信息的文字反馈;检测用户的性别;检测用户的年龄;获取并存储男性语音库、女性语音库和儿童语音库;当检测出用户为男性且不是儿童时,选择女性语音库对文字反馈进行语音合成,生成女声语音文件回复用户;当检测出用户为女性且不是儿童时,选择男性语音库对文字反馈进行语音合成,生成男声语音文件回复用户;当检测出用户为儿童时,选择儿童语音库对文字反馈进行语音合成,生成卡通语音文件回复用户。该方法能够根据说话者年龄和性别进行有差别的、不同语调的语音回复。

【技术实现步骤摘要】

本专利技术涉及语音识别以及语音合成,具体地涉及一种。
技术介绍
在现有语音识别处理及反馈系统中,通常包括三个重要的组成部分:语音识别、语音理解和语音回复。在第三部分语音回复这个模块,所采用的是单一语音语调和无差别回复,基本只能分为男声和女声,用户对于不同语音的需求也只能通过提前设置来进行选择。无法满足用户对于多样性语音回复的需求,更无法针对当前说话用户来自动地转换为用户喜好的语首回复。传统语音识别处理以及反馈系统,操作平台可为带有网络功能的各种多媒体平台如手机,或者移动终端等,此处以电视平台为例。传统语音识别处理以及反馈系统主要分为如下三个模块:语音识别模块、语音理解和处理模块、语音回复模块。系统预先设置固定语音语调回复,一般分为男声和女声,需要在系统设置由用户自行选择,回复内容男女生一致。图1为传统语音识别处理以及反馈系统中的语音回复方法示意图。如图1所示,当任何一类用户(如男人,女人或者儿童)首先对系统进行语音输入,明确各自的指令。系统对用户的语音输入进行识别,将语音信息转化为文字信息。然后进入语音理解和处理模块,对文字信息进一步理解和分析,得出相应的文字反馈。最终转入语音回复模块,文字反馈会被输入语音合成库,语音库一般分为男声和女声,用户需要提前设置选择,被选择的语音库可以生成语音文件,最终将语音反馈给用户。这种语音回复和反馈服务是:1,同样的发音;2,同样的反馈。 专利技术人在实现本专利技术的过程中发现,现有技术存在的问题至少包括:1、语音回复单一传统的系统一般只会集成I到2个语音库,使用时需要用户自行选择。因此无论哪一类用户所听到的语音反馈都只有一种语音语调。用户在长期使用的过程中,会产生听觉疲劳。即使再有的语音系统中加入了身份识别功能,但是在最终的语音回复模块也只是增加了个性化服务,并没有对语音和语调进行过相应的调整。2、无法吸引儿童群体对于儿童群体来说,语音系统的吸引力更多的体现在听说的互动的体验上,对于当前传统的语音系统,无法满足儿童群体对于多样性和趣味性的要求。因此无法调动这个群体的使用兴趣。从某种意义上阻碍了将语音系统拓展为一种教育方式的潜在功能。
技术实现思路
本专利技术的目的在于,克服现有技术的不足,提供一种,以便于在语音系统中向用户提供多种个性化的、差异化的语音回复功能,能够根据说话者年龄和性别进行有差别的、不同语调的语音回复。一方面,为达上述目的,本专利技术实施例提供了一种语音识别处理及反馈系统,所述系统包括:语音采集单元,用于采集用户的语音信息;语音识别单元,用于对采集的用户的语音信息进行识别,将识别出的语音信息转化为文字信息;语音理解和处理单元,所述语音理解和处理单元包括:文字反馈模块,用于生成地应于所述文字信息的文字反馈;性别检测模块,用于检测用户的性别;以及,年龄检测模块,用于检测用户的年龄;存储单元,用于存储语音库,所述语音库包括:男性语音库、女性语音库和儿童语音库;语音回复单元,包括语音合成模块和语音播放模块,所述语音合成模块用于当检测出的用户为男性且不是儿童时,选择所述女性语音库对所述文字反馈进行语音合成,生成女声语音文件;当检测出的用户为女性且不是儿童时,选择所述男性语音库对所述文字反馈进行语音合成,生成男声语音文件;当检测出的用户为儿童时,选择所述儿童语音库对所述文字反馈进行语音合成,生成卡通语音文件;所述语音播放单元,用于播放所述语音合成模块生成的相应的语音文件。另一方面,为达上述目的,本专利技术实施例提供了一种语音识别处理及反馈系统的语音回复方法,所述方法包括:采集用户的语音信息;对采集的用户的语音信息进行识别,将识别出的语音信息转化为文字信息;生成地应于所述文字信息的文字反馈;检测用户的性别;检测用户的年龄;获取并存储语音库,所述语音库包括:男性语音库、女性语音库和儿童语音库;当检测出的用户为男性且不是儿童时,选择女性语音库对所述文字反馈进行语音合成,生成女声语音文件回复所述用户;当检测出的用户为女性且不是儿童时,选择男性语音库对所述文字反馈进行语音合成,生成男声语音文件回复所述用户;当检测出的用户为儿童时,选择儿童语音库对所述文字反馈进行语音合成,生成卡通语音文件回复所述用户。本专利技术实施例的上述技术方案的有益技术效果在于:1,在语音系统中,本专利技术提供用户多种个性化的,差异化的语音回复功能,将原本只有2种语音回复的单一选择,提升到η种选择,增强用户的好感度和用户体验,提高用户使用该产品的兴趣,增加购买该产品的机率。2,本专利技术对于儿童群体来说,多样性和趣味性的语音调动了这个群体的使用兴趣。将语音系统拓展为一种潜在的教育系统。同时在识别儿童身份信息的基础上,还可以对J L童的视听内容进行监控。附图说明为了更清楚地说明 本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为传统语音识别处理以及反馈系统中的语音回复方式的示意图;图2为本专利技术实施例的语音识别处理及反馈系统的系统功能框图;图3为本专利技术另一实施例中语音识别处理及反馈系统的具体功能框图;图4为本专利技术实施例的语音识别处理及反馈系统检测使用者性别及年龄来自动选择回复语音的示意图;图5为本专利技术实施例的语音识别处理及反馈系统采集喜好对象的声音特征由系统合成作为回复语音的示意图;图6为本专利技术实施例的语音回复方法的流程图。具体实施例方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供了一种语音识别处理及反馈系统。图2为本专利技术实施例的系统功能框图,如图2所示,该系统100包括:语音采集单元110,用于 采集用户的语音信息;语音识别(Speech Recognition)单元120,用于对采集的用户的语音进行识别,将识别出的语音信息转化为文字信息;语音理解和处理(LanguageUnderstanding and Processing)单兀 130,其包括:文字反馈模块131,用于生成地应于所述文字信息的文字反馈;性别检测(genderdetection)模块132,用于检测用户的性别;以及,年龄检测(age detection,儿童或者成人)模块133,用于检测用户的年龄;存储单元140,用于存储语音库,所述语音库包括:男性语音库、女性语音库和儿童语音库;语音回复单元150,包括语音合成(Text to Speech)模块151和语音播放模块152,所述语音合成模块151用于当检测出的用户为男性且不是儿童时,选择所述女性语音库对所述文字反馈进行语音合成,生成女声语音文件;当检测出的用户为女性且不是儿童时,选择所述男性语音库对所述文字反馈进行语音合成,生成男声语音文件;当检测出的用户为儿童时,选择所述儿童语音库对所述文字反馈进行语音合成,生成卡通语音文件;所述语音播放本文档来自技高网
...

【技术保护点】
一种语音识别处理及反馈系统,其特征在于,所述系统包括:语音采集单元,用于采集用户的语音信息;语音识别单元,用于对采集的用户的语音信息进行识别,将识别出的语音信息转化为文字信息;语音理解和处理单元,所述语音理解和处理单元包括:文字反馈模块,用于生成地应于所述文字信息的文字反馈;性别检测模块,用于检测用户的性别;以及,年龄检测模块,用于检测用户的年龄;存储单元,用于存储语音库,所述语音库包括:男性语音库、女性语音库和儿童语音库;语音回复单元,包括语音合成模块和语音播放模块,所述语音合成模块用于当检测出的用户为男性且不是儿童时,选择所述女性语音库对所述文字反馈进行语音合成,生成女声语音文件;当检测出的用户为女性且不是儿童时,选择所述男性语音库对所述文字反馈进行语音合成,生成男声语音文件;当检测出的用户为儿童时,选择所述儿童语音库对所述文字反馈进行语音合成,生成卡通语音文件;所述语音播放单元,用于播放所述语音合成模块生成的相应的语音文件。

【技术特征摘要】

【专利技术属性】
技术研发人员:毛惟谦王珏彭培源郑园蓁
申请(专利权)人:乐金电子研发中心上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1