基于区块链的语音识别方法、装置、介质及电子设备制造方法及图纸

技术编号:21550132 阅读:21 留言:0更新日期:2019-07-06 22:49
本发明专利技术实施例提供了一种基于区块链的语音识别方法、装置、介质及电子设备,该基于区块链的语音识别方法包括:在区块链中存储标注的历史语音数据;若所述区块链中生成当前语音信息的新区块,则触发采用训练完成的声学模型和语言模型识别所述当前语音信息,输出与所述当前语音信息对应的当前文本信息;其中,所述声学模型和所述语言模型采用所述区块链中标注的历史语音数据训练获得。本发明专利技术实施例的技术方案能够采用区块链技术来存储用户的语音数据,并能够基于存储的历史语音数据进行当前语音的识别。

Speech Recognition Method, Device, Media and Electronic Equipment Based on Block Chain

【技术实现步骤摘要】
基于区块链的语音识别方法、装置、介质及电子设备
本专利技术涉及电数据处理
,具体而言,涉及一种基于区块链的语音识别方法、装置、介质及电子设备。
技术介绍
现有技术中,语音识别技术已经在多种应用场景中采用,例如智能手机和平板电脑上的语音识别机器人、电商购物平台的语音助手辅助用户购物等。但是,在语音识别过程中,会将语音相关信息存储至数据库中,现有的中心化的存储方式容易被攻击,且数据存储结构简单,容易被篡改,用户在语音识别过程中容易信息泄露,导致用户信息被篡改,识别结果出错。此外,目前并未有专门针对老年人这个特殊群体进行优化识别的语音识别技术,老年人相比于普通人,声音低沉、含糊不清、带有浓重的地方方言特色发音等特点,均使得其语音信号更难以被准确识别。因此,需要一种新的语音识别方法、装置、计算机可读介质及电子设备。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本专利技术实施例的目的在于提供一种基于区块链的语音识别方法、装置、介质及电子设备,进而至少在一定程度上克服相关技术中存在的中心化存储语音信息带来的安全性不够的问题。本专利技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术的实践而习得。根据本公开的一个方面,提供一种基于区块链的语音识别方法,包括:在区块链中存储标注的历史语音数据;若所述区块链中生成当前语音信息的新区块,则触发采用训练完成的声学模型和语言模型识别所述当前语音信息,输出与所述当前语音信息对应的当前文本信息;其中,所述声学模型和所述语言模型采用所述区块链中标注的历史语音数据训练获得。在本公开的一种示例性实施例中,所述标注的历史语音数据包括历史语音信息、从所述历史语音信息中提取的历史声学特征以及作为所述历史语音信息的标签的历史音素信息;所述声学模型为长短期记忆网络模型;所述方法还包括:将所述历史声学特征及其历史音素信息作为第一训练数据集;利用所述第一训练数据集,并采用连接时序分类作为训练过程中的损失函数训练所述长短期记忆网络模型。在本公开的一种示例性实施例中,所述语言模型为递归神经网络模型;所述标注的历史语音数据还包括作为所述历史音素信息的标签的历史文本信息;所述方法还包括:将所述历史音素信息及其历史文本信息作为第二训练数据集;利用所述第二训练数据集训练所述递归神经网络模型。在本公开的一种示例性实施例中,采用训练完成的声学模型和语言模型识别所述当前语音信息,输出与所述当前语音信息对应的当前文本信息,包括:提取所述当前语音信息的当前声学特征;将所述当前声学特征输入至所述长短期记忆网络模型,输出当前音素信息;将所述当前音素信息输入至所述递归神经网络模型,输出所述当前文本信息。在本公开的一种示例性实施例中,所述标注的历史语音数据包括目标区域目标人群的方言语音信息和作为所述方言语音信息的标签的方言文本信息;所述方法还包括:将所述方言语音信息及其方言文本信息作为第三训练数据集;利用所述第三训练数据集训练所述声学模型和所述语言模型;其中,所述当前语音信息采集自所述目标区域的所述目标人群。在本公开的一种示例性实施例中,所述方法还包括:从所述区块链中采集所述目标区域的所述目标人群的方言词语;对所述方言词语进行处理建立多个二部图;获得所述多个二部图中的最佳匹配;根据获得的最佳匹配确定相应方言语音信息的方言文本信息。在本公开的一种示例性实施例中,对所述方言词语进行处理建立多个二部图,包括:将各方言词语分别拆分成多个独立的子集,其中每个子集中的元素没有相连的边;根据所述目标区域的方言词语之间的固定搭配确定不同子集中元素的连接关系,形成二部图的边;获得各边的子集之间的关联概率,并将所述关联概率作为相应边的权重。根据本公开的一个方面,提供一种基于区块链的语音识别装置,包括:历史语音数据存储模块,用于在区块链中存储标注的历史语音数据;当前文本信息识别模块,用于若所述区块链中生成当前语音信息的新区块,则触发采用训练完成的声学模型和语言模型识别所述当前语音信息,输出与所述当前语音信息对应的当前文本信息;其中,所述声学模型和所述语言模型采用所述区块链中标注的历史语音数据训练获得。根据本公开的一个方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的基于区块链的语音识别方法。根据本公开的一个方面,提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述任一实施例所述的基于区块链的语音识别方法。本专利技术实施例提供的技术方案可以包括以下有益效果:在本专利技术的一些实施例所提供的技术方案中,一方面,通过利用区块链技术来存储标注的历史语音数据和待识别的当前语音数据,可以实现去中心化的存储方式,具有隐私保护、可追溯、防篡改等特点,保证了存储的数据的安全性和可靠性,从而可以防止语音识别过程中用户数据的信息泄露,提高了语音识别的安全性和准确性;另一方面,可以基于区块链中存储的标注的历史语音数据训练声学模型和语言模型,并在区块链中生成新区块的同时,触发采用训练完成的声学模型和语言模型识别所述当前语音信息,输出与所述当前语音信息对应的当前文本信息,从而可以实现语音识别功能。在本专利技术的另一些实施例所提供的技术方案中,若区块链中存储的标注的历史语音数据均采集自目标人群,例如该目标人群为老年人群体,则训练过程中,模型会自动优化老年人的语音(例如具有口齿不清、语音含糊、语调低沉乏力等特点),进而可以提高老年人语音识别的准确性。更进一步的,若该老年人群体的语音数据具有目标区域的方言夹杂在其中,则还可以利用二部图关联迭代优化分析的方法确定该目标区域的方言的固定搭配,并利用二部图获得的最佳匹配作为训练数据训练所述声学模型和所述语言模型,从而可以使得模型具有该目标区域的方言识别能力,提高了方言语音识别的准确性,从而可以有力促进区块链技术应用在老年人语音识别方面。随着区块链技术在老年人语音识别、医疗养老和理财服务管理、保险、金融、物流等多个领域的广泛应用,该方案将可以带来可观的经济效益和社会效益。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:图1示意性示出了根据本专利技术的一个实施例的基于区块链的语音识别方法的流程图;图2示意性示出了根据本专利技术的另一个实施例的基于区块链的语音识别方法的流程图;图3示意性示出了根据本专利技术的另一个实施例的基于区块链的语音识别方法的流程图;图4示意性示出了图1中的步骤S120的一个实施例的流程图;图5示意性示出了根据本专利技术的又一个实施例的基于区块链的语音识别方法的流程图;图6示意性示出了根据本专利技术的再一个实施例的基于区块链的语音识别方法的流程图;图7示意性示出了根据本专利技术的一个实本文档来自技高网...

【技术保护点】
1.一种基于区块链的语音识别方法,其特征在于,包括:在区块链中存储标注的历史语音数据;若所述区块链中生成当前语音信息的新区块,则触发采用训练完成的声学模型和语言模型识别所述当前语音信息,输出与所述当前语音信息对应的当前文本信息;其中,所述声学模型和所述语言模型采用所述区块链中标注的历史语音数据训练获得。

【技术特征摘要】
1.一种基于区块链的语音识别方法,其特征在于,包括:在区块链中存储标注的历史语音数据;若所述区块链中生成当前语音信息的新区块,则触发采用训练完成的声学模型和语言模型识别所述当前语音信息,输出与所述当前语音信息对应的当前文本信息;其中,所述声学模型和所述语言模型采用所述区块链中标注的历史语音数据训练获得。2.根据权利要求1所述的方法,其特征在于,所述标注的历史语音数据包括历史语音信息、从所述历史语音信息中提取的历史声学特征以及作为所述历史语音信息的标签的历史音素信息;所述声学模型为长短期记忆网络模型;所述方法还包括:将所述历史声学特征及其历史音素信息作为第一训练数据集;利用所述第一训练数据集,并采用连接时序分类作为训练过程中的损失函数训练所述长短期记忆网络模型。3.根据权利要求2所述的方法,其特征在于,所述语言模型为递归神经网络模型;所述标注的历史语音数据还包括作为所述历史音素信息的标签的历史文本信息;所述方法还包括:将所述历史音素信息及其历史文本信息作为第二训练数据集;利用所述第二训练数据集训练所述递归神经网络模型。4.根据权利要求3所述的方法,其特征在于,采用训练完成的声学模型和语言模型识别所述当前语音信息,输出与所述当前语音信息对应的当前文本信息,包括:提取所述当前语音信息的当前声学特征;将所述当前声学特征输入至所述长短期记忆网络模型,输出当前音素信息;将所述当前音素信息输入至所述递归神经网络模型,输出所述当前文本信息。5.根据权利要求1所述的方法,其特征在于,所述标注的历史语音数据包括目标区域目标人群的方言语音信息和作为所述方言语音信息的标签的方言文本信息;所述方法还包括:将所述方言语音...

【专利技术属性】
技术研发人员:李夫路梁爽刘新宇
申请(专利权)人:泰康保险集团股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1