一种用于智能语音饮水机的多方言混合语音识别方法技术

技术编号：29706500 阅读：64 留言：0更新日期：2021-08-17 14:36

本发明专利技术公开了一种用于智能语音饮水机的多方言混合语音识别方法，包括：将初始待识别语音作为目标语音，通过一个或多个方言识别子系统对目标语音进行处理，得到语义文本；获取与语义文本对应的时序数列信息；获取各方言识别子系统对应方言的种类；将各语义文本及时序数列信息加入到相应方言识别子系统的历史分词集；获取未处理目标语音；循环执行对应目标语音的语义文本和时序数列信息的获取操作；根据方言识别子系统对应的历史分词集，结合语义文本和对应的时序数列信息，形成一条或多条分词序列；基于各分词序列构成相应方言识别子系统的分词序列集；从各方言识别子系统所对应的分词序列集中确定初始待识别语音的识别结果。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于智能语音饮水机的多方言混合语音识别方法
本专利技术涉及智能饮水机方言识别领域，更具体地说，本专利技术涉及一种用于智能语音饮水机的多方言混合语音识别方法。
技术介绍
目前，语音识别技术对于各地方言的识别能力尚待提高；如何对目标语音进行处理，得到语义文本是一项技术关键点；方言的语音特点和常用的语音特点也不相同；如何通过方言的语音转化语义、并获取对应时序数列信息，是一项具有实际意义的创新研究方向；各种方言的多种表达方式和标准普通话存在着很大的不同，如何获取对应方言的种类是一项技术难点；将各语义文本及时序数列信息进行结合是一项较为关键的技术点，在方言识别时如何处理难以识别的部分一直以来都是本领域技术难点；如何高效率准确的进行对应目标语音的语义文本和时序数列信息的获取操作，并将方言识别子系统对应形成一条或多条分词序列是一项核心技术点；如何基于各分词序列，并从各方言识别子系统所对应的分词序列集中确定初始待识别语音的识别结果，是一项较有创新性的技术；因此，有必要提出一种用于智能语音饮水机的多方言混合语音识别方法，以至少部分地解决现有技术中存在的问题。
技术实现思路
在
技术实现思路
部分中引入了一系列简化形式的概念，这将在具体实施方式部分中进一步详细说明。本专利技术的
技术实现思路
部分并不意味着要试图限定出所要求保护的技术方案的关键特征和必要技术特征，更不意味着试图确定所要求保护的技术方案的保护范围。为至少部分地解决上述问题，本专利技术提供了一种用于智能语音饮水机的多方言混合语音识别方法，包括：>S100、将初始待识别语音作为目标语音，通过一个或多个方言识别子系统对目标语音进行处理，得到语义文本；S200、获取与语义文本对应的时序数列信息，获取各方言识别子系统对应方言的种类；S300、将各语义文本及时序数列信息加入到相应方言识别子系统的历史分词集，获取各方言识别子系统对应的未处理目标语音得到新目标语音；S400、循环执行S100-S300，直至各方言识别子系统均不存在未处理目标语音；S500、根据方言识别子系统对应的历史分词集并形成一条或多条分词序列，基于分词序列构成相应方言识别子系统的分词序列集；S600、从各方言识别子系统所对应的分词序列集中确定初始待识别语音的识别结果。优选的，S100包括：S101、在饮水机中搭载数据库存储器，并在存储器中预先存储数据，预存储数据包括：与饮水机功能相关词汇的语义文本、不同地区方言的初始分词集；S102、当饮水机接收到用户语音时，将语音作为初始待识别语音进行处理，调用一个或多个方言识别子系统；S103、将方言语音和标准语音进行对比计算，确定待识别语音的初始置信度；S104、计算待识别语音的置信度系数，计算公式如下：其中，S12是待识别语音的置信度系数；Z1和Z2是方言语音和标准语音两种语音特征，Pi和Qj是语音特征的两个序列特征元集，rZ1和rZ2是两种语音特征的初始置信度；识别待识别语音的置信度，包括：当待识别语音的置信度系数S12≥0.9时，方言语音和标准语音两种语音特征识别为符合一致性；当待识别语音的置信度系数S12<0.9时，返回S102循环调用执行，直至方言语音和标准语音两种语音特征识别为符合一致性；S105、识别符合一致性后，获得方言语音和标准语音对应符合一致性的语义文本；优选的，S200中，所述获取与语义文本对应的时序数列信息，包括：S2011、对于用户语音中的信息进行处理，获得和不同语义文本相关的多类型信息；对多类型信息进行识别，提取出其中包含的事件因素；对事件因素进行进一步分析，从中挑选出时序要素；S2012、对不同语义文本包含的各组事件因素进行进一步分析，按照时序要素建立多条用户时序数列，将各种事件因素以时序要素为基准排列在用户时序数列上；对用户语音的语气进行分析，根据不同语气选择不同操作；当分析得到用户语音为第一语气，则从用户时序数列过往记录中选择与用户语音的事件因素相符合的记录作为答案；S2013、当分析得到用户语音为第二语气，则继续以时序要素为基准将事件因素排列在用户时序数列上；根据不同操作，通过将用户语音为第一语气时从用户时序数列过往记录中选择和用户语音为第二语气以时序要素为基准的事件因素排列，得到对应的时序数列信息。优选的，S200中，所述获取各方言识别子系统对应方言的种类，包括：S2021、对当前待处理用户语音进行处理以辨别语音中存在的音节与音素，通过预处理提取方言语音中的语音参数，包括：音节名称、音素名称、音素持续时间、音素共振峰；S2022、通过对语音参数进行统计，计算语音参数统计平均值计算公式如下：其中，为语音参数统计平均值，N为样本个数，n为样本总数，为语音参数的平均值，xi为从某个语音样本中得到的语音参数；通过统计平均值对不同地域的方言进行进一步区分；S2023、通过第一类方言的方言识别子系统对当前语音样本进行分析，当某段音节所具备的各项语音参数和方言识别子系统中所存储的各项参数值偏差小于设定范围，则判定为该待处理语音中含有该类方言；当某段音节所具备的各项语音参数和方言识别子系统中所存储的各项参数值偏差不小于设定范围，则判定为该待处理语音中不含有该类方言；S2024、通过第二类方言的方言识别子系统，继续对当前待处理的语音样本进行分析，重复步骤S2021～S2023的分析过程，对用户语音是否含有方言种类进行判断；方言种类包括：初始待识别语音所包含方言的种类；S2025、重复调用饮水机的方言识别子系统，直至语音样本中所有预先存储的方言种类都已被识别出来；S2026、将语音样本的内容按照方言种类进行归类。优选的，S300中，所述将各语义文本及时序数列信息加入到相应方言识别子系统的历史分词集，包括：S3011、在各个方言识别子系统中分别建立相应方言的历史分词集，历史分词集中存储内容包括：来自用户语音方言部分；S3012、将语义文本依据所属方言存储在历史分词集中；S3013、当用户时序数列出现更新时，将历史分词集中的用户时序数列进行更新；S3014、当待处理语音被处理和区分完毕时，将出现的新语义文本添加到历史分词集中。优选的，S300中，所述获取各方言识别子系统对应的未处理目标语音得到新目标语音，包括：S3021、当饮水机接收到新的用户语音时，将新的用户语音作为待处理语音，将待处理语音同存储器中已经识别过的语音片段所含有的语音参数进行对比，确定当前待处理语音是否已经被提取语义文本和分类到相应方言识别子系统下；S3022、对于待处理语音中和已经识别过的语音片段的语音参数偏差小于设定偏差的部分，作为已经处理部分；S3023、对于待处理语音中和已经识别过的语音片段的语音参数偏差不小于设定偏差的部分，进行提取作为新的目标语音。优选的，S400，包括：S401、针对新的目标语音，使用不同的方言识本文档来自技高网...

【技术保护点】
1.一种用于智能语音饮水机的多方言混合语音识别方法，其特征在于，包括：/nS100、将初始待识别语音作为目标语音，通过一个或多个方言识别子系统对目标语音进行处理，得到语义文本；/nS200、获取与语义文本对应的时序数列信息，获取各方言识别子系统对应方言的种类；/nS300、将各语义文本及时序数列信息加入到相应方言识别子系统的历史分词集，获取各方言识别子系统对应的未处理目标语音得到新目标语音；/nS400、循环执行S100-S300，直至各方言识别子系统均不存在未处理目标语音；/nS500、根据方言识别子系统对应的历史分词集并形成一条或多条分词序列，基于分词序列构成相应方言识别子系统的分词序列集；/nS600、从各方言识别子系统所对应的分词序列集中确定初始待识别语音的识别结果。/n

【技术特征摘要】
1.一种用于智能语音饮水机的多方言混合语音识别方法，其特征在于，包括：
S100、将初始待识别语音作为目标语音，通过一个或多个方言识别子系统对目标语音进行处理，得到语义文本；
S200、获取与语义文本对应的时序数列信息，获取各方言识别子系统对应方言的种类；
S300、将各语义文本及时序数列信息加入到相应方言识别子系统的历史分词集，获取各方言识别子系统对应的未处理目标语音得到新目标语音；
S400、循环执行S100-S300，直至各方言识别子系统均不存在未处理目标语音；
S500、根据方言识别子系统对应的历史分词集并形成一条或多条分词序列，基于分词序列构成相应方言识别子系统的分词序列集；
S600、从各方言识别子系统所对应的分词序列集中确定初始待识别语音的识别结果。

2.根据权利要求1所述的一种用于智能语音饮水机的多方言混合语音识别方法，其特征在于，S100包括：
S101、在饮水机中搭载数据库存储器，并在存储器中预先存储数据，预存储数据包括：与饮水机功能相关词汇的语义文本、不同地区方言的初始分词集；
S102、当饮水机接收到用户语音时，将语音作为初始待识别语音进行处理，调用一个或多个方言识别子系统；
S103、将方言语音和标准语音进行对比计算，确定待识别语音的初始置信度；
S104、计算待识别语音的置信度系数，计算公式如下：

其中，S12是待识别语音的置信度系数；Z1和Z2是方言语音和标准语音两种语音特征，Pi和Qj是语音特征的两个序列特征元集，rZ1和rZ2是两种语音特征的初始置信度；识别待识别语音的置信度，包括：当待识别语音的置信度系数S12≥0.9时，方言语音和标准语音两种语音特征识别为符合一致性；当待识别语音的置信度系数S12<0.9时，返回S102循环调用执行，直至方言语音和标准语音两种语音特征识别为符合一致性；
S105、识别符合一致性后，获得方言语音和标准语音对应符合一致性的语义文本。

3.根据权利要求1所述的一种用于智能语音饮水机的多方言混合语音识别方法，其特征在于，S200中，所述获取与语义文本对应的时序数列信息，包括：
S2011、对于用户语音中的信息进行处理，获得和不同语义文本相关的多类型信息；对多类型信息进行识别，提取出其中包含的事件因素；对事件因素进行进一步分析，从中挑选出时序要素；
S2012、对不同语义文本包含的各组事件因素进行进一步分析，按照时序要素建立多条用户时序数列，将各种事件因素以时序要素为基准排列在用户时序数列上；对用户语音的语气进行分析，根据不同语气选择不同操作；当分析得到用户语音为第一语气，则从用户时序数列过往记录中选择与用户语音的事件因素相符合的记录作为答案；
S2013、当分析得到用户语音为第二语气，则继续以时序要素为基准将事件因素排列在用户时序数列上；根据不同操作，通过将用户语音为第一语气时从用户时序数列过往记录中选择和用户语音为第二语气以时序要素为基准的事件因素排列，得到对应的时序数列信息。

4.根据权利要求1所述的一种用于智能语音饮水机的多方言混合语音识别方法，其特征在于，S200中，所述获取各方言识别子系统对应方言的种类，包括：
S2021、对当前待处理用户语音进行处理以辨别语音中存在的音节与音素，通过预处理提取方言语音中的语音参数，包括：音节名称、音素名称、音素持续时间、音素共振峰；
S2022、通过对语音参数进行统计，计算语音参数统计平均值计算公式如下：

其中，为语音参数统计平均值，N为样本个数，n为样本总数，为语音参数的平均值，xi为从某个语音样本中得到的语音参数；通过统计平均值对不同地域的方言进行进一步区分；
S2023、通过第一类方言的方言识别子系统对当前语音样本进行分析，当某段音节所具备的各项语音参数和方言识别子系统中所存储的各项参数值偏差小于设定范围，则判定为该待处理语音中含有该类方言；当某段音节所具备的各项语音参数和方言识别子系统中所存储的各项参数值偏差不小于设定范围，则判定为该待处理语音中不含有该类方言；
S2024、通过第二类方言的方言识别子系统，继续对当前待处理的语音样本进行分析，重复步骤S2021～S2023的分析过程，对用户语音是否含有方言种类进行判断；方言种类包括：初始待识别语音所包含方言的种类；
S2025、重复调用饮水机的方言识别子系统，...

【专利技术属性】
技术研发人员：陈芒，
申请(专利权)人：深圳市轻生活科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人