一种语音识别的方法及终端技术

技术编号:21660859 阅读:28 留言:0更新日期:2019-07-20 06:10
本发明专利技术提供一种语音识别的方法及终端,属于语音识别技术领域,其可至少部分解决现有的语音识别的方法对于方言识别时造成中心服务器需要处理的数据量大、成本高的问题。本发明专利技术的一种语音识别的方法,基于语音识别的终端,方法包括:确定当前方言;获取用户的语音信息,在预设的方言深度学习框架下,根据语音信息以及预设的通用识别模型,训练得到对应当前方言的方言信息模型,预设的通用识别模型用于识别语音信息;将方言信息模型发送至中心服务器,以供中心服务器训练得到对应当前方言的方言识别模型,方言识别模型用于识别当前方言。

A Speech Recognition Method and Terminal

【技术实现步骤摘要】
一种语音识别的方法及终端
本专利技术属于语音识别
,具体涉及一种语音识别的方法及终端。
技术介绍
随着用户需求的不断增长,方言语音识别的运用在电子设备中日益重要。现有的方言语音识别的方法主要是通过用户终端将用户的方言语音信息以及地理位置多次地发送至中心服务器,再由中心服务器根据多个用户的方言语音信息以及地理位置不断训练以及解析,最终形成方言语音识别模块。但是我国的方言种类繁多,如果将各个地区的方言语音信息都多次地发送至中心服务器进行训练和解析,会导致方言语音信息的数据在中心服务器过于集中,使得中心服务器需要处理的数据量大,从而使得中心服务器从硬件和软件的投入成本大。
技术实现思路
本专利技术至少部分解决现有的语音识别的方法对于方言识别时造成中心服务器需要处理的数据量大、成本高的问题,提供一种减少中心服务器处理的数据量及成本的语音识别的方法。解决本专利技术技术问题所采用的技术方案是一种语音识别的方法,基于语音识别的终端,所述方法包括:确定当前方言;获取用户的语音信息,在预设的方言深度学习框架下,根据所述语音信息以及预设的通用识别模型,训练得到对应当前方言的方言信息模型,所述预设的通用识别模型用于识别所述语音信息;将所述方言信息模型发送至中心服务器,以供所述中心服务器训练得到对应当前方言的方言识别模型,所述方言识别模型用于识别当前方言。进一步优选的是,所述获取用户的语音信息,在预设的方言深度学习框架下,根据所述语音信息以及预设的通用识别模型,训练得到对应当前方言的方言信息模型包括:接收所述用户的语音输入;用所述预设的通用识别模型识别所述语音输入的候选意图;将所述语音输入的候选意图提供给所述用户;接收所述用户对所述语音输入的候选意图的反馈信息,以得到调整参数;在所述预设的方言深度学习框架下,根据所述调整参数训练得到对应当前方言的方言信息模型。进一步优选的是,在得到对应当前方言的方言信息模型步骤后,还包括:判断所述方言信息模型是否训练完成;若是,则进行所述将所述方言信息模型发送至中心服务器的步骤;若否,则返回所述接受所述接收所述用户的语音输入的步骤。进一步优选的是,所述获取用户的语音信息,在预设的方言深度学习框架下,根据所述语音信息以及预设的通用识别模型,训练得到对应当前方言的方言信息模型之前还包括:接收来自所述中心服务器的所述预设的通用识别模型以及所述预设的方言深度学习框架。进一步优选的是,所述确定当前方言包括:获取当前地理位置,根据所述当前地理位置确定当前方言。解决本专利技术技术问题所采用的技术方案是一种语音识别的终端,包括:第一获取模块,用于确定当前方言;模型建立模块,用于获取用户的语音信息,在预设的方言深度学习框架下,根据所述语音信息以及预设的通用识别模型,训练得到对应当前方言的方言信息模型,所述预设的通用识别模型用于识别所述语音信息;发送模块,用于将所述方言信息模型发送至中心服务器,以供所述中心服务器训练得到对应当前方言的方言识别模型,所述方言识别模型用于识别当前方言。进一步优选的是,模型建立模块包括:接收子模块,用于接收所述用户的语音输入,以及接收所述用户对所述语音输入的候选意图的反馈信息,以得到调整参数;输出子模块,用于将所述语音输入的候选意图提供给所述用户;模型建立子模块,用于在所述预设的方言深度学习框架下,根据所述调整参数训练得到对应当前方言的方言信息模型。进一步优选的是,该语音识别的终端还包括:判断模块,用于判断所述方言信息模型是否训练完成。进一步优选的是,该语音识别的终端还包括:第二获取模块,用于接收来自所述中心服务器的所述预设的通用识别模型以及所述预设的方言深度学习框架。进一步优选的是,所述第一获取模块包括:第一获取子模块,用于获取当前地理位置,根据所述当前地理位置确定当前方言。本专利技术的语音识别的方法中,在预设的方言深度学习框架下,终端根据语音信息以及预设的通用识别模型,训练得到对应当前方言的方言信息模型,以供以供中心服务器训练得到方言识别模型。与现有技术语音识别的方法(方言信息模型是在中心服务器形成的)相比,本专利技术的语音识别的方法能够减少中心服务器中方言信息量,从而减少中心服务器需要处理的数据,进而使得中心服务器从硬件和软件的投入成本降低。附图说明图1为本专利技术的实施例的一种语音识别的方法的流程示意图;图2为本专利技术的实施例的一种语音识别的方法的流程示意图;图3为本专利技术的实施例的一种语音识别的终端的组成示意框图。具体实施方式为使本领域技术人员更好地理解本专利技术的技术方案,下面结合附图和具体实施方式对本专利技术作进一步详细描述。实施例1:如图1所示,本实施例提供一种语音识别的方法,基于语音识别的终端,方法包括:S11、确定当前方言。其中,也就是说确定当前所处位置的方言的类型,例如若终端处于广东省范围内,方言的类型是广东话,若终端处于浙江省范围内,方言的类型是浙江话等。S12、获取用户的语音信息,在预设的方言深度学习框架下,根据语音信息以及预设的通用识别模型,训练得到对应当前方言的方言信息模型,预设的通用识别模型用于识别语音信息。其中,也就是说预设的通用识别模型可以识别语音信息(例如普通话等),但是预设的通用识别模型对具体的方言语音信息的识别不是很准确,因此需要根据用户的语音信息以及预设的通用识别模型训练得到对应当前方言的方言信息模型。优选的,用户的语音信息与终端所处的地理位置的方言是对应的。S13、将方言信息模型发送至中心服务器,以供中心服务器训练得到对应当前方言的方言识别模型,方言识别模型用于识别当前方言。其中,也就是说方言信息模型包含关于当前方言语音的信息。当中心服务器接收到当前方言的方言识别模型,则会对该方言识别模型进行训练以形成专门识别该当前方言的方言识别模型。需要说明的是,中心服务器可以接受来自多个终端的多个方言信息模型,该多个方言信息模型可以是不同种方言的方言识别模型。中心服务器可以将这些方言信息模型提供的信息进行筛选、分类等,最终形成完善的多种方言识别模型(每种方言识别模型对应一种不同的方言),并将各个方言识别模型发送至与其对应的终端。本专利技术的语音识别的方法中,在预设的方言深度学习框架下,终端根据语音信息以及预设的通用识别模型,训练得到对应当前方言的方言信息模型,以供以供中心服务器训练得到方言识别模型。与现有技术语音识别的方法(方言信息模型是在中心服务器形成的)相比,本专利技术的语音识别的方法能够减少中心服务器中的方言信息量,从而减少中心服务器需要处理的数据,进而使得中心服务器从硬件和软件的投入成本降低。此外,由于终端属于轻量级的训练设备,且该终端在形成方言信息模型的过程中与中心服务器不链接,因此,在终端在形成方言信息模型的过程中响应速度快,从而可以提高效率,节省用户时间。同时在终端在形成方言信息模型的过程中,充分利用了该终端IT资源(如中央处理器CPU等),避免资源的浪费。实施例2:如图2所示,本实施例提供一种语音识别的方法,基于语音识别的终端,该方法包括:S21、接收来自中心服务器的预设的通用识别模型以及预设的方言深度学习框架。例如,终端可以从中心服务器下载相关的软件,该软件中包括预设的通用识别模型和预设的方言深度学习框架。具体的,预设的通用识别模型可以识别语音信息(例如普通话等)本文档来自技高网...

【技术保护点】
1.一种语音识别的方法,基于语音识别的终端,其特征在于,所述方法包括:确定当前方言;获取用户的语音信息,在预设的方言深度学习框架下,根据所述语音信息以及预设的通用识别模型,训练得到对应当前方言的方言信息模型,所述预设的通用识别模型用于识别所述语音信息;将所述方言信息模型发送至中心服务器,以供所述中心服务器训练得到对应当前方言的方言识别模型,所述方言识别模型用于识别当前方言。

【技术特征摘要】
1.一种语音识别的方法,基于语音识别的终端,其特征在于,所述方法包括:确定当前方言;获取用户的语音信息,在预设的方言深度学习框架下,根据所述语音信息以及预设的通用识别模型,训练得到对应当前方言的方言信息模型,所述预设的通用识别模型用于识别所述语音信息;将所述方言信息模型发送至中心服务器,以供所述中心服务器训练得到对应当前方言的方言识别模型,所述方言识别模型用于识别当前方言。2.根据权利要求1所述的语音识别的方法,其特征在于,所述获取用户的语音信息,在预设的方言深度学习框架下,根据所述语音信息以及预设的通用识别模型,训练得到对应当前方言的方言信息模型包括:接收所述用户的第一语音输入;用所述预设的通用识别模型识别所述语音输入的候选意图;将所述语音输入的候选意图提供给所述用户;接收所述用户对所述语音输入的候选意图的反馈信息,以得到调整参数;在所述预设的方言深度学习框架下,根据所述调整参数训练得到对应当前方言的方言信息模型。3.根据权利要求2所述的语音识别的方法,其特征在于,在得到对应当前方言的方言信息模型步骤后,还包括:判断所述方言信息模型是否训练完成;若是,则进行所述将所述方言信息模型发送至中心服务器的步骤;若否,则返回所述接受所述接收所述用户的语音输入的步骤。4.根据权利要求1所述的语音识别的方法,其特征在于,所述获取用户的语音信息,在预设的方言深度学习框架下,根据所述语音信息以及预设的通用识别模型,训练得到对应当前方言的方言信息模型之前还包括:接收来自所述中心服务器的所述预设的通用识别模...

【专利技术属性】
技术研发人员:龙岳
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1