语音处理方法及装置制造方法及图纸

技术编号:16176803 阅读:37 留言:0更新日期:2017-09-09 04:09
本发明专利技术是关于一种语音处理方法及装置,其中,方法包括:接收终端设备发送的当前采集的语音信息;对所述语音信息进行语音识别,得到语音识别结果;根据所述语音识别结果确定是否结束采集所述语音信息;在确定结束采集所述语音信息后,发送停止采集指令至所述终端设备,以使所述终端设备停止采集所述语音信息。通过该技术方案,由服务器根据语音信息的语音识别结果确定结束采集语音信息的时间,进而发送停止采集指令至终端设备,这样,终端设备就可以根据该停止采集指令停止采集语音信息。这样,根据语音信息的语音识别结果确定何时停止采集语音信息,可以更准确的判断语音信息停止的时间。

【技术实现步骤摘要】
语音处理方法及装置
本专利技术涉及语音识别
,尤其涉及一种语音处理方法及装置。
技术介绍
现有技术中,由客户端采集语音信息,发送给服务器,对于语音信息何时采集结束,是由客户端通过简单的能量检测进行判断的,但是由于客户端没有语音识别功能,因此,现有的客户端的判断方式不够准确。
技术实现思路
本专利技术实施例提供一种语音处理方法及装置,用以实现准确的判断语音信息的采集结束时间,从而提升用户的使用体验。根据本专利技术实施例的第一方面,提供一种语音处理方法,用于服务器,包括:接收终端设备发送的当前采集的语音信息;对所述语音信息进行语音识别,得到语音识别结果;根据所述语音识别结果确定是否结束采集所述语音信息;在确定结束采集所述语音信息后,发送停止采集指令至所述终端设备,以使所述终端设备停止采集所述语音信息。在该实施例中,由服务器根据语音信息的语音识别结果确定结束采集语音信息的时间,进而发送停止采集指令至终端设备,这样,终端设备就可以根据该停止采集指令停止采集语音信息。这样,根据语音信息的语音识别结果确定何时停止采集语音信息,可以更准确的判断语音信息停止的时间。在一个实施例中,对所述语音信息进行语音识别,得到语音识别结果,包括:对所述语音信息进行语音识别,以生成所述语音信息对应的文本信息和静音信息;根据所述文本信息、所述静音信息和所述文本信息中上下文之间的相关性,将所述文本信息划分为有效文本信息和非有效文本信息,其中,所述非有效文本信息包括静音信息和无效文本信息;从所述文本信息中提取出所述有效文本信息,并执行所述有效文本信息对应的处理操作;丢弃所述非有效文本信息。在该实施例中,对语音信息进行识别,得到文本信息和静音信息,进而将文本信息划分为有效文本信息和非有效文本信息,从而将非有效文本信息丢弃,将有效文本信息作为语音识别结果,这样,使得语音识别结果更准确。在一个实施例中,所述根据所述语音识别结果确定是否结束采集所述语音信息,包括:统计所述非有效文本信息的连续时长;当所述连续时长大于或者等于预设时长时,确定结束采集所述语音信息。在该实施例中,根据非有效文本信息的连续时长确定结束采集语音信息的时间,可以使得结束时间更准确,避免采集过多的无用语音。在一个实施例中,从所述文本信息中提取出所述有效文本信息,并执行所述有效文本信息对应的处理操作,包括:从所述文本信息中提取出所述有效文本信息;对所述有效文本信息进行语义解析,得到语义解析结果;根据所述语义解析结果确定所述有效文本信息是否完整;当确定所述有效文本信息完整时,执行所述有效文本信息对应的处理操作。在该实施例中,文本信息中包含了用户意图,例如“今天天气怎么样”,对有效文本信息进行语义解析,可以确定有效文本信息中的用户意图是否完整,即有效文本信息是否完整。例如,“今天天气怎么样”即是一个完整的用户意图,“导航到”即是一个不完整的用户意图,因为其并没有地点。在有效文本信息完整时,及时执行对应的处理操作,可以尽快满足用户意图,提升用户的使用体验。在一个实施例中,所述方法还包括:当确定所述有效文本信息不完整时,等待下一个有效文本信息,并确定所述有效文本信息和所述下一个有效文本信息结合后的结合有效文本信息是否完整;当确定所述结合有效文本信息完整时,执行所述结合有效文本信息对应的处理操作。在该实施例中,在有效文本信息不完整时,即用户意图不完整时,可以等待下一个有效文本信息,这样,在将两个有效文本信息结合后得到完整的有效文本信息再执行对应的处理操作,从而保证执行到完整的用户意图,满足用户的需求。根据本专利技术实施例的第二方面,提供一种语音处理装置,用于服务器,包括:接收模块,用于接收终端设备发送的当前采集的语音信息;识别模块,用于对所述语音信息进行语音识别,得到语音识别结果;确定模块,用于根据所述语音识别结果确定是否结束采集所述语音信息;发送模块,用于在确定结束采集所述语音信息后,发送停止采集指令至所述终端设备,以使所述终端设备停止采集所述语音信息。在一个实施例中,所述识别模块包括:生成子模块,用于对所述语音信息进行语音识别,以生成所述语音信息对应的文本信息和静音信息;划分子模块,用于根据所述文本信息、所述静音信息和所述文本信息中上下文之间的相关性,将所述文本信息划分为有效文本信息和非有效文本信息,其中,所述非有效文本信息包括静音信息和无效文本信息;提取子模块,用于从所述文本信息中提取出所述有效文本信息,并执行所述有效文本信息对应的处理操作;丢弃子模块,用于丢弃所述非有效文本信息。在一个实施例中,所述确定模块包括:统计子模块,用于统计所述非有效文本信息的连续时长;确定子模块,用于当所述连续时长大于或者等于预设时长时,确定结束采集所述语音信息。在一个实施例中,所述提取子模块用于:从所述文本信息中提取出所述有效文本信息;对所述有效文本信息进行语义解析,得到语义解析结果;根据所述语义解析结果确定所述有效文本信息是否完整;当确定所述有效文本信息完整时,执行所述有效文本信息对应的处理操作。在一个实施例中,所述装置还包括:等待模块,用于当确定所述有效文本信息不完整时,等待下一个有效文本信息,并确定所述有效文本信息和所述下一个有效文本信息结合后的结合有效文本信息是否完整;执行模块,用于当确定所述结合有效文本信息完整时,执行所述结合有效文本信息对应的处理操作。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。图1是根据一示例性实施例示出的一种语音处理方法的流程图。图2是根据一示例性实施例示出的一种语音处理方法中步骤S102的流程图。图3是根据一示例性实施例示出的一种语音处理方法中步骤S103的流程图。图4是根据一示例性实施例示出的一种语音处理方法中步骤S203的流程图。图5是根据一示例性实施例示出的另一种语音处理方法的流程图。图6是根据一示例性实施例示出的一种语音处理装置的框图。图7是根据一示例性实施例示出的一种语音处理装置中识别模块的框图。图8是根据一示例性实施例示出的一种语音处理装置中确定模块的框图。图9是根据一示例性实施例示出的另一种语音处理装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的装置和方法的例子。图1是根据一示例性实施例示出的一种语音处理方法的流程图。该语音处理方法应用于服务器中。如图1所示,该方法包括步骤S101-S104:在步骤S101中,接收终端设备发送的当前采集的语音信息;其中,终端设备通过语音唤醒功能开始采集用户语音,将本文档来自技高网...
语音处理方法及装置

【技术保护点】
一种语音处理方法,用于服务器,其特征在于,包括:接收终端设备发送的当前采集的语音信息;对所述语音信息进行语音识别,得到语音识别结果;根据所述语音识别结果确定是否结束采集所述语音信息;在确定结束采集所述语音信息后,发送停止采集指令至所述终端设备,以使所述终端设备停止采集所述语音信息。

【技术特征摘要】
1.一种语音处理方法,用于服务器,其特征在于,包括:接收终端设备发送的当前采集的语音信息;对所述语音信息进行语音识别,得到语音识别结果;根据所述语音识别结果确定是否结束采集所述语音信息;在确定结束采集所述语音信息后,发送停止采集指令至所述终端设备,以使所述终端设备停止采集所述语音信息。2.根据权利要求1所述的方法,其特征在于,对所述语音信息进行语音识别,得到语音识别结果,包括:对所述语音信息进行语音识别,以生成所述语音信息对应的文本信息和静音信息;根据所述文本信息、所述静音信息和所述文本信息中上下文之间的相关性,将所述文本信息划分为有效文本信息和非有效文本信息,其中,所述非有效文本信息包括静音信息和无效文本信息;从所述文本信息中提取出所述有效文本信息,并执行所述有效文本信息对应的处理操作;丢弃所述非有效文本信息。3.根据权利要求2所述的方法,其特征在于,所述根据所述语音识别结果确定是否结束采集所述语音信息,包括:统计所述非有效文本信息的连续时长;当所述连续时长大于或者等于预设时长时,确定结束采集所述语音信息。4.根据权利要求2所述的方法,其特征在于,从所述文本信息中提取出所述有效文本信息,并执行所述有效文本信息对应的处理操作,包括:从所述文本信息中提取出所述有效文本信息;对所述有效文本信息进行语义解析,得到语义解析结果;根据所述语义解析结果确定所述有效文本信息是否完整;当确定所述有效文本信息完整时,执行所述有效文本信息对应的处理操作。5.根据权利要求2所述的方法,其特征在于,所述方法还包括:当确定所述有效文本信息不完整时,等待下一个有效文本信息,并确定所述有效文本信息和所述下一个有效文本信息结合后的结合有效文本信息是否完整;当确定所述结合有效文本信息完整时,执行所述结合有效文本信息对应的处理操作。6.一种语音处理装置...

【专利技术属性】
技术研发人员:全刚
申请(专利权)人:北京云知声信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1