语音服务方法和语音服务系统技术方案

技术编号:3851476 阅读:189 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种语音服务方法和语音服务系统,其中,语音服务方法包括:通过语音卡采集客户端输入的用于标识所述客户端的语音服务请求的初始语音信息;对所述初始语音信息进行预处理得到标准语音信息,所述预处理包括语音端点检测和降噪处理;对所述标准语音信息进行语音识别得到识别结果信息;根据所述识别结果信息向所述客户端返回与所述初始语音信息对应的语音服务结果信息。本发明专利技术可以减少按键输入,增强与用户的交互性;使输入语音识别引擎的语音尽量符合标准,可以发挥引擎最大功效;实现了多路话路共用一个语音识别引擎,提高引擎利用率。

【技术实现步骤摘要】

本专利技术涉及语音识别领域,特别涉及一种语音服务方法和语音服务系统
技术介绍
随着农村信息化建设的快速发展,为农民用户提供信息服务的农业语音 热线也正在全国大力开展和建设,数个省市已经开通相关服务热线。目前, 农业语音热线大多都采用传统的语音菜单提示和用户按4建输入选择的方式来 完成语音交互过程。例如,农民用户如果要查询某种蔬菜的价格,需要在进 入该语音热线的价格查询菜单后,通过按键选择所要查询的蔬菜,才能得到 该蔬菜的价格信息。专利技术人在实现本专利技术的过程中发现,现有技术的农业语音热线至少存在以下技术缺陷上述按键输入选择的方式在信息选择项较少的情况下,尚为 可行,但是当农业服务中心提供的服务较多时,例如,可以提供几十种蔬菜 的价格信息,则此时农民在查询农产品价格信息时,收听提示音时间就要在 3分钟以上,效率非常低下,十分不方便,交互性较差。因此,农民用户更 习惯于直接转接人工服务,使得农业语音热线的自动语音回复部分建成后长 期处于闲置状态,无人问津,造成语音服务的资源浪费,也阻碍了农村信息 化建设的快速发展。
技术实现思路
本专利技术的目的是提供一种语音服务方法和语音服务系统,解决语音服务 交互性较差和效率低下的问题,实现语音服务交互性更强,效率提高。 本专利技术实施例提供了一种语音服务方法,其特征在于,包括 通过语音卡采集客户端输入的用于标识所述客户端的语音服务请求的初始"i吾音信息;对所述初始语音信息进行预处理得到标准语音信息,所述预处理包括语音端点;险测和降噪处理;对所述标准语音信息进行语音识别得到识别结果信息;根据所述识别结果信息向所述客户端返回与所述初始语音信息对应的语音服务结果信息。本专利技术实施例还提供了一种语音服务系统,其特征在于,包括输入冲莫块、 预处理模块、识别模块和输出模块;所述输入模块,用于通过语音卡采集客户端输入的用于标识所述客户端 的语音服务请求的初始语音信息;所述预处理模块,用于对所述初始语音信息进行预处理得到标准语音信 息,所述预处理包括语音端点^r测和降噪处理;所述识别模块,用于对所述标准语音信息进行语音识别得到识别结果信自 所述输出模块,用于根据所述识别结果信息向所述客户端返回与所述初 始语音信息对应的语音服务结果信息。本专利技术语音服务方法和语音服务系统通过将语音卡与语音识别技术相结 合,直接釆用自然语言进行语言服务,可以减少按键输入,增强与用户的交互性;通过采用语音预处理技术,使得进行语音识别的语音信息更加符合语 音识别的标准,提高i吾音识别的效率。附图说明图1为本专利技术实施例一提供的语音服务方法的流程示意图; 图2为本专利技术实施例二提供的语音服务系统的结构示意图。具体实施例方式本专利技术的主要专利技术思想即为将语音识别技术与传统语音服务系统中的语音卡相结合共同组建语音服务系统,使用自然语音发出指令,避免连续^4建的过程,提高语音服务系统的工作效率,增强语音服务的交互性。下面通过附图和具体实施例,对本专利技术的技术方案作进一步详细说明。 图1为本专利技术实施例一提供的语音服务方法的流程示意图,如图1所示,本实施例的语音服务方法主要包括以下步骤步骤101、采用语音卡釆集客户端输入的用于标识客户端的语音服务请 求的初始语音信息。语音服务系统中的硬件语音卡和公共电话网连接,在此基础上,可以采 用语音卡对用户通过公共电话网输入的语音信号进行采集录音。具体实施中, 可以定义一个变量,调用语音卡函数对用户输入的语音信号进行录音,可以 设定定长的录音时间,将该段时间内用户的语音全部录制下来,得到初始音 频文件即初始语音信息,并将音频文件存储在该变量中,等待下一步处理。 该初始语音信息可以标识客户端的语音服务请求,例如,农民用户在查询蔬 菜价格时,可以语音方式输入"白菜",该"白菜"即为初始语音信息,其 标识了该农民用户的语音服务请求为想查询白菜的价格。步骤102、对初始语音信息进行预处理得到标准语音信息,该预处理包 括语音端点;险测和降噪处理。通过语音卡采集的用户初始语音信息中包括了很多无音部分和噪音部 分,如果将该初始语音信息直接输入语音识别引擎中进行语音识别,会使得 语音识别引擎的识别效率不高,因此,需要在语音识别以前对该初始语音信 息进行预处理,去掉非语音部分,并尽量滤掉音频中的噪音。该预处理主要 包括语音端点;险测和降噪处理两个部分。首先,进行语音端点检测,可以设定起始端点长度参数和结束端点长度 参数,并根据该起始端点长度参数和结束端点长度参数检测得到初始语音信 息的起始端点和结束端点,该起始端点和结束端点之间的语音信息为语音部 分信息,并去掉初始语音信息中的上述语音部分信息之外的无语音部分信息。其中,起始端点长度参数越小越敏感,越容易及时检测出语音信息;数值越大越不敏感,越容易过滤掉初始语音信息中的脉沖噪音; 一般将该起始 端点长度参数推荐设置为200ms (快语速说一个关键词需要300ms以上,正 常语速为500s以上)。例如,假设设定起始端点长度参数为200ms,则如果 初始语音信息即初始音频文件检测到音频文件的长度已经从音频开始点延续 时间达到200ms,就标识该音频文件已经开始,即4企测到了该音频文件的起 始端点,该起始端点为从200ms的起始点。在通过起始端点长度参数检测到初始语音信息的起始端点后,再根据结 束端点长度参数检测初始语音信息的结束端点,该结束端点长度参数用以表 示在检测到起始端点后,连续多长时间的静音数据被认为是真正的结束端点。 本参数数值越小越敏感,越容易及时检测出来是语音结束;反之,数值越大 越不敏感,如果说话人有短暂的说话停顿不会被认为是语音结束; 一般将该 起始端点长度参数推荐设置为3s (根据正常人的语音停顿习惯确定)。例如, 假设设定结束端点长度参数为ls,则当检测到初始语音信息中的起始端点后, 再检测到出现ls的静音,就标识已经到达初始语音信息的结束端点,该结束 端点即为ls的起始点。此外,在该语音端点检测中还可以设置过长语音长度参数,根据过长语 音长度参数检测得到初始语音信息的结束端点。例如,当检测到初始语音信 息的起始端点后,连续过长时间都不再有语音信号,则此时该定连续过长时 间的语音数据也被认为是结束端点。该过长语音长度参数可以依据最长时间 会说多长时间的一个关键词来设定; 一般将该起始端点长度参数推荐设置为 2s。例如,假设设定过长语音长度参数为2s,则当检测到初始语音信息中的 起始端点后,再检测到出现2s的静音,而正常的初始语音信息一般都不大于 2s,该2s即为过长语音信息,其标识已经到达初始语音信息的结束端点,此 时,可以认为该初始语音信息无效,可以不对其进行语音识别。其次,在语音端点检测完毕,已经检测得到初始语音信息的起始端点和 结束端点的基础上,再对初始语音信息进行降噪处理,以便滤掉背景噪声, 保留人的声音。该降噪处理包括设定噪声门限值,该噪声门限值可以根据系统应用环境及采用的设备进行具体设定,可以设定为在这个门限值以下为 背景噪声,在这个门限值以上为人的声音,并采用滤波器滤去经过语音端点 检测后的初始语音信息中位于噪声门限值之下的初始语音信息即噪声。通过上述的预处理过程,得到的语音信息已基本符合标准,如果将该标 准语音信息输入到语音识别本文档来自技高网...

【技术保护点】
一种语音服务方法,其特征在于,包括: 通过语音卡采集客户端输入的用于标识所述客户端的语音服务请求的初始语音信息; 对所述初始语音信息进行预处理得到标准语音信息,所述预处理包括语音端点检测和降噪处理; 对所述标准语音信息进行 语音识别得到识别结果信息; 根据所述识别结果信息向所述客户端返回与所述初始语音信息对应的语音服务结果信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:高万林李桢于丽娜杨颖
申请(专利权)人:中国农业大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利