语音处理方法及装置、存储介质及处理器制造方法及图纸

技术编号:20285842 阅读:92 留言:0更新日期:2019-02-10 18:08
本发明专利技术公开了一种语音处理方法及装置、存储介质及处理器。其中,该方法包括:获取预设时间段内多个时刻的语音向量;利用预设语音模型对多个时刻的语音向量进行处理,得到与多个时刻的语音向量相对应的多个文本信息,其中,预设语音模型基于预先存储的多个时刻的参数向量对多个时刻的语音向量进行处理;输出多个文本信息。本发明专利技术解决了现有技术中的语音处理方法的处理效率低的技术问题。

Speech Processing Method and Device, Storage Media and Processor

The invention discloses a voice processing method and device, a storage medium and a processor. Among them, the method includes: acquiring voice vectors at multiple times in a preset time period; processing voice vectors at multiple times with preset voice model, and obtaining multiple text information corresponding to voice vectors at multiple times, in which the preset voice model processes voice vectors at multiple times based on parameter vectors stored at multiple times in advance; Text information. The invention solves the technical problem of low processing efficiency of the voice processing method in the prior art.

【技术实现步骤摘要】
语音处理方法及装置、存储介质及处理器
本专利技术涉及数据处理领域,具体而言,涉及一种语音处理方法及装置、存储介质及处理器。
技术介绍
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现用户与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。目前常用的自然语言处理方法有:条件随机场CRF,隐马尔科夫模型HMM,递归神经网络模型RNN和长短期记忆模型LSTM等,但是,为了提高处理精度,需要增加模型深度,导致处理复杂度高,处理效率低。针对现有技术中的语音处理方法的处理效率低的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种语音处理方法及装置、存储介质及处理器,以至少解决现有技术中的语音处理方法的处理效率低的技术问题。根据本专利技术实施例的一个方面,提供了一种语音处理方法,包括:获取预设时间段内多个时刻的语音向量;利用预设语音模型对多个时刻的语音向量进行处理,得到与多个时刻的语音向量相对应的多个文本信息,其中,预设语音模型基于预先存储的多个时刻的参数向量对多个时刻的语音向量进行处理;输出多个文本信息。进一步地,预设语音模型包括:语音处理模型和参数矩阵,参数矩阵用于预先存储多个时刻的参数向量,语音处理模型用于基于多个时刻的参数向量对多个时刻的语音向量进行处理,得到与多个时刻的语音向量相对应的多个文本信息。进一步地,利用预设语音模型对多个时刻的语音向量进行处理,得到与多个时刻的语音向量相对应的多个文本信息,包括:根据读操作从参数矩阵中获取多个时刻的第一参数向量;利用多个时刻的第一参数向量对语音处理模型进行修正,得到修正后的语音处理模型;利用修正后的语音处理模型对多个时刻的语音向量进行处理,得到多个文本信息。进一步地,在利用修正后的语音处理模型对多个时刻的语音向量进行处理,得到多个文本信息的同时,上述方法还包括:利用修正后的语音处理模型,得到多个时刻的第二参数向量;根据写操作将多个时刻的第二参数向量写入参数矩阵。进一步地,利用修正后的语音处理模型,得到多个时刻的第二参数向量,包括:利用修正后的语音处理模型对多个时刻的第一参数向量进行更新,得到多个时刻的第二参数向量。进一步地,在利用预设语音模型对多个时刻的语音向量进行处理,得到与多个时刻的语音向量相对应的多个文本信息之前,上述方法还包括:建立初始预设模型,初始预设模型包括:语音处理模型和初始参数矩阵;获取训练数据,其中,训练数据包括:多个训练语音向量,以及每个训练语音向量相对应的文本信息;根据训练数据对初始预设模型进行训练,得到预设语音模型。进一步地,根据训练数据对初始预设模型进行训练,得到预设语音模型包括:将训练数据输入语音处理模型,得到预设参数向量;通过写操作将预设参数向量写入初始参数矩阵,得到参数矩阵。进一步地,语音处理模型为LSTM模型,参数矩阵为记忆矩阵。进一步地,根据预设语音模型的处理能力,确定预设时间段。根据本专利技术实施例的另一方面,还提供了一种语音处理装置,包括:第一获取模块,用于获取预设时间段内多个时刻的语音向量;处理模块,用于利用预设语音模型对多个时刻的语音向量进行处理,得到与多个时刻的语音向量相对应的多个文本信息,其中,预设语音模型基于预先存储的多个时刻的参数向量对多个时刻的语音向量进行处理;输出模块,用于输出多个文本信息。进一步地,预设语音模型包括:语音处理模型和参数矩阵,参数矩阵用于预先存储多个时刻的参数向量,语音处理模型用于基于多个时刻的参数向量对多个时刻的语音向量进行处理,得到与多个时刻的语音向量相对应的多个文本信息。进一步地,处理模块包括:获取子模块,用于根据读操作从参数矩阵中获取多个时刻的第一参数向量;修正子模块,用于利用多个时刻的第一参数向量对语音处理模型进行修正,得到修正后的语音处理模型;第一处理子模块,用于利用修正后的语音处理模型对多个时刻的语音向量进行处理,得到多个文本信息。进一步地,处理模块还包括:第二处理子模块,用于利用修正后的语音处理模型,得到多个时刻的第二参数向量;第一存储子模块,用于根据写操作将多个时刻的第二参数向量写入参数矩阵。进一步地,所述第二处理子模块还用于利用修正后的语音处理模型对多个时刻的第一参数向量进行更新,得到多个时刻的第二参数向量。进一步地,上述装置还包括:建立模块,用于建立初始预设模型,初始预设模型包括:语音处理模型和初始参数矩阵;第二获取模块,用于获取训练数据,其中,训练数据包括:多个训练语音向量,以及每个训练语音向量相对应的文本信息;训练模块,用于根据训练数据对初始预设模型进行训练,得到预设语音模型。进一步地,训练模块包括:第三处理子模块,用于将训练数据输入语音处理模型,得到预设参数向量;第二存储子模块,用于通过写操作将预设参数向量写入初始参数矩阵,得到预设语音模型。进一步地,语音处理模型为LSTM模型,参数矩阵为记忆矩阵。进一步地,上述装置还包括:确定模块,用于根据预设语音模型的处理能力,确定预设时间段。根据本专利技术实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述实施例中的语音处理方法。根据本专利技术实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述实施例中的语音处理方法。在本专利技术实施例中,获取预设时间段内多个时刻的语音向量,利用预设语音模型对多个时刻的语音向量进行处理,得到与多个时刻的语音向量相对应的多个文本信息,输出多个文本信息,从而实现自然语言处理。容易注意到的是,由于获取到的是预设时间段内多个时刻的语音向量,并且预设语音模型基于预先存储的多个时刻的参数向量对多个时刻的语音向量进行处理,从而实现利用自然语音的时序性特征,结合神经图灵机的记忆矩阵和LSTM模型,对自然语音进行处理,进而解决了现有技术中的语音处理方法的处理效率低的技术问题。因此,通过本专利技术上述实施例提供的方案,可以达到提高处理效率、提高处理准确度、降低处理复杂度、减少处理时间的效果。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种语音处理方法的流程图;图2是根据本专利技术实施例的一种可选的预设语音模型的示意图;图3是根据本专利技术实施例的一种可选的语音处理模型的重复模块的示意图;以及图4是根据本专利技术实施例的一种语音处理装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的本文档来自技高网
...

【技术保护点】
1.一种语音处理方法,其特征在于,包括:获取预设时间段内多个时刻的语音向量;利用预设语音模型对所述多个时刻的语音向量进行处理,得到与所述多个时刻的语音向量相对应的多个文本信息,其中,所述预设语音模型基于预先存储的多个时刻的参数向量对所述多个时刻的语音向量进行处理;输出所述多个文本信息。

【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:获取预设时间段内多个时刻的语音向量;利用预设语音模型对所述多个时刻的语音向量进行处理,得到与所述多个时刻的语音向量相对应的多个文本信息,其中,所述预设语音模型基于预先存储的多个时刻的参数向量对所述多个时刻的语音向量进行处理;输出所述多个文本信息。2.根据权利要求1所述的方法,其特征在于,所述预设语音模型包括:语音处理模型和参数矩阵,所述参数矩阵用于预先存储所述多个时刻的参数向量,所述语音处理模型用于基于所述多个时刻的参数向量对所述多个时刻的语音向量进行处理,得到与所述多个时刻的语音向量相对应的多个文本信息。3.根据权利要求2所述的方法,其特征在于,利用预设语音模型对所述多个时刻的语音向量进行处理,得到与所述多个时刻的语音向量相对应的多个文本信息,包括:根据读操作从所述参数矩阵中获取所述多个时刻的第一参数向量;利用所述多个时刻的第一参数向量对所述语音处理模型进行修正,得到修正后的语音处理模型;利用所述修正后的语音处理模型对所述多个时刻的语音向量进行处理,得到所述多个文本信息。4.根据权利要求3所述的方法,其特征在于,在利用所述修正后的语音处理模型对所述多个时刻的语音向量进行处理,得到所述多个文本信息的同时,所述方法还包括:利用所述修正后的语音处理模型,得到所述多个时刻的第二参数向量;根据写操作将所述多个时刻的第二参数向量写入所述参数矩阵。5.根据权利要求4所述的方法,其特征在于,利用所述修正后的语音处理模型,得到所述多个时刻的第二参数向量,包括:利用所述修正后的语音处理模型对所述多个时刻的第一参数向量进行更新,得到所述多个时刻的第二参数向量。6.根据权利要求2所述...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:深圳光启合众科技有限公司深圳光启创新技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1