语音信号处理方法及装置制造方法及图纸

技术编号:13593662 阅读:129 留言:0更新日期:2016-08-26 06:49
本发明专利技术实施例提供一种语音信号处理方法及装置。语音信号处理方法包括:接收客户端发送的语音信号;对语音信号进行语音识别,以获得文本数据;对文本数据进行固定句式语义解析,以获得包括固定句式和实体词的初始解析结果;将初始解析结果中的实体词转换为拼音流,以获得中间解析结果;将中间解析结果发送给客户端,以供客户端利用本地信息库对中间解析结果中的拼音流进行修正后获得最终解析结果。采用本发明专利技术实施例对语音信号进行语义解析,可以提高语义解析的准确度。

【技术实现步骤摘要】

本专利技术实施例涉及语音识别
,尤其涉及一种语音信号处理方法及装置
技术介绍
随着语音识别技术的发展,基于语音识别的应用越来越多,例如语音拨号、语音导航、语音播放控制、语音信息检索等。在基于语音识别的应用中,都需要对语音信号进行语义解析,提取语音信号所表达的用户意图,并转换成机器能够理解的结构化数据格式。现有技术主要使用预设的语义解析模板与语音识别出的字符串进行匹配的方法来对语音信号进行语义解析。这种方法要求语义解析模板足够多,但实际上语义解析模板的数量是有限的,而语音信号的表达方式又是多种多样,所以经常出现一些无法精准匹配的情况,导致无法准确解析语音信号的语义。
技术实现思路
本专利技术实施例提供一种语音信号处理方法及装置,用以对语音信号进行语义解析,提高语义解析的准确度。本专利技术实施例提供一种语音信号处理方法,包括:接收客户端发送的语音信号;对所述语音信号进行语音识别,以获得文本数据;对所述文本数据进行固定句式语义解析,以获得包括固定句式和实体词的初始解析结果;将所述初始解析结果中的实体词转换为拼音流,以获得中间解析结果;将所述中间解析结果发送给所述客户端,以供所述客户端利用本地信息库对所述中间解析结果中的拼音流进行修正后获得最终解析结果。本专利技术实施例提供另一种语音信号处理方法,包括:向服务端发送语音信号,以供所述服务端对所述语音信号进行语义解析;接收所述服务端返回的中间解析结果,所述中间解析结果是所述服务端将初始解析结果中的实体词转换为拼音流后获得的,所述中间解析结果包括所述初始解析结果中的固定句式和所述实体词转换成的拼音流;利用本地信息库对所述中间解析结果中的拼音流进行修正,以获得最终解析结果。本专利技术实施例提供一种语音信号处理装置,位于服务端实现,所述装置包括:接收模块,用于接收客户端发送的语音信号;语音识别模块,用于对所述语音信号进行语音识别,以获得文本数据;语义解析模块,用于对所述文本数据进行固定句式语义解析,以获得包括固定句式和实体词的初始解析结果;转换模块,用于将所述初始解析结果中的实体词转换为拼音流,以获得中间解析结果;发送模块,用于将所述中间解析结果发送给所述客户端,以供所述客户端利用本地信息库对所述中间解析结果中的拼音流进行修正后获得最终解析结果。本专利技术实施例提供另一种语音信号处理装置,位于客户端实现,所述装置包括:发送模块,用于向服务端发送语音信号,以供所述服务端对所述语音信号进行语义解析;接收模块,用于接收所述服务端返回的中间解析结果,所述中间解析结果是所述服务端将初始解析结果中的实体词转换为拼音流后获得的,所述中
间解析结果包括所述初始解析结果中的固定句式和所述实体词转换成的拼音流;修正模块,用于利用本地信息库对所述中间解析结果中的拼音流进行修正,以获得最终解析结果。本专利技术实施例提供的语音信号处理方法及装置,在服务端,采用固定句式语义解析方式对语音信号对应的文本数据进行语义解析,获得包括固定句式和实体词的初始解析结果,将初始解析结果中的实体词转换为拼音流,以获得中间解析结果,将中间解析结果发送给客户端,在客户端,利用本地信息库对接收到的中间解析结果中的拼音流进行修正,以获得最终解析结果。本专利技术实施例将服务端解析与客户端修正相结合,充分发挥客户端本地信息库对部分实体词在语义解析上的作用,对服务端无法准确解析的结果进行修正,提高了语义解析的准确度,同时有利于减少服务端存储的语义解析模板的数量。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的语音信号处理方法的流程示意图;图2为本专利技术另一实施例提供的语音信号处理方法的流程示意图;图3为本专利技术又一实施例提供的语音信号处理装置的结构示意图;图4为本专利技术又一实施例提供的语音信号处理装置的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本发
明实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在现有技术中,主要使用预设的语义解析模板与语音识别出的字符串进行匹配的方法来对语音信号进行语义解析。这种方法要求语义解析模板足够多,但实际上语义解析模板的数量是有限的,而语音信号的表达方式又是多种多样,所以经常出现一些无法精准匹配的情况,导致无法准确解析语音信号的语义。以语音拨号为例,可能有语音信号“请给张三拨打电话”对应的语义解析模板,但可能没有语音信号“请给李四打电话”的语义解析模板,所以“请给李四打电话”可能无法准备解析出语音信号“请给李四打电话”的语义。针对上述问题,本专利技术实施例提供一种解决方案,主要原理是:在服务端,采用固定句式语义解析方式对语音信号对应的文本数据进行语义解析,获得包括固定句式和实体词的初始解析结果,实体词的不确定性较高,因此将初始解析结果中的实体词转换为拼音流,以获得中间解析结果,将中间解析结果发送给客户端,在客户端,利用本地信息库对接收到的中间解析结果中的拼音流进行修正,以获得最终解析结果。本专利技术实施例将服务端解析与客户端修正相结合,充分发挥客户端本地信息库对部分实体词在语义解析上的作用,对服务端无法准确解析的结果进行修正,提高了语义解析的准确度,同时有利于减少服务端存储的语义解析模板的数量。下面通过具体实施例对本专利技术技术方案进行详细说明。图1为本专利技术一实施例提供的语音信号处理方法的流程示意图。如图1所示,该方法包括:101、接收客户端发送的语音信号。102、对语音信号进行语音识别,以获得文本数据。103、对文本数据进行固定句式语义解析,以获得包括固定句式和实体词的初始解析结果。104、将初始解析结果中的实体词转换为拼音流,以获得中间解析结果。105、将中间解析结果发送给所述客户端,以供客户端利用本地信息库对中间解析结果中的拼音流进行修正后获得最终解析结果。本实施例提供一种语音信号处理方法,可由语音信号处理装置来执行,用以对语音信号进行语义解析,提高语义解析的准确度。本实施例提供的方法适用于各种需要对语音信号进行语义解析的应用场景,例如语音拨号、语音导航、语音播放控制、语音信息检索等。其中,语音信号处理装置可位于各应用场景中的服务端实现。具体的,在各应用场景中,客户端采集用户的语音信号,例如对用户的语音进行录制,从而获取用户的语音信号,然后将语音信号发送给服务端,具体来说是发送给服务端的语音信号处理装置。语音信号处理装置接收客户端发送的语音信号。可选的,客户端发送语音信号之前,可以对语音信号进行模数转换、编码、压缩等处理。相应的,语音信号处理装置接收到语音信号之后,可以对语音信号经解压缩、解码等处理,并针对处理后的语音信号进行语义解析处理。在获得语音信号之后,语音信号处理装置可以对语音信号进行语音识别,以获得文本数据。举例说明,假设用户本文档来自技高网
...

【技术保护点】
一种语音信号处理方法,其特征在于,包括:接收客户端发送的语音信号;对所述语音信号进行语音识别,以获得文本数据;对所述文本数据进行固定句式语义解析,以获得包括固定句式和实体词的初始解析结果;将所述初始解析结果中的实体词转换为拼音流,以获得中间解析结果;将所述中间解析结果发送给所述客户端,以供所述客户端利用本地信息库对所述中间解析结果中的拼音流进行修正后获得最终解析结果。

【技术特征摘要】
1.一种语音信号处理方法,其特征在于,包括:接收客户端发送的语音信号;对所述语音信号进行语音识别,以获得文本数据;对所述文本数据进行固定句式语义解析,以获得包括固定句式和实体词的初始解析结果;将所述初始解析结果中的实体词转换为拼音流,以获得中间解析结果;将所述中间解析结果发送给所述客户端,以供所述客户端利用本地信息库对所述中间解析结果中的拼音流进行修正后获得最终解析结果。2.根据权利要求1所述的方法,其特征在于,所述对所述文本数据进行固定句式语义解析,以获得包括固定句式和实体词的初始解析结果,包括:利用预设的固定句式解析模板与所述文本数据进行匹配,以获得所述文本数据匹配中的目标固定句式解析模板,所述目标固定句式解析模板包括固定表达部分和待定表达部分;将所述文本数据中对应所述固定表达部分的内容作为所述初始解析结果中的固定句式,将所述文本数据中对应所述待定表达部分的内容作为所述初始解析结果中的实体词。3.根据权利要求1或2所述的方法,其特征在于,所述对所述文本数据进行固定句式语义解析,以获得包括固定句式和实体词的初始解析结果之前,包括:利用预设的通用语义解析模板与所述文本数据进行匹配,并在未匹配中通用语义解析模板时,触发执行对所述文本数据进行固定句式语义解析,以获得包括固定句式和实体词的初始解析结果的操作。4.一种语音信号处理方法,其特征在于,包括:向服务端发送语音信号,以供所述服务端对所述语音信号进行语义解析;接收所述服务端返回的中间解析结果,所述中间解析结果是所述服务端
\t将初始解析结果中的实体词转换为拼音流后获得的,所述中间解析结果包括所述初始解析结果中的固定句式和所述实体词转换成的拼音流;利用本地信息库对所述中间解析结果中的拼音流进行修正,以获得最终解析结果。5.根据权利要求4所述的方法,其特征在于,所述利用本地信息库对所述中间解析结果中的拼音流进行修正,以获得最终解析结果,包括:将所述拼音流在所述本地信息库中进行匹配,以获得所述拼音流对应的实体词;将所述固定句式与所述拼音流对应的实体词进行组合,以获得所...

【专利技术属性】
技术研发人员:王育军
申请(专利权)人:乐视控股北京有限公司乐视致新电子科技天津有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1