区分地域性口音的语音数据识别方法和装置制造方法及图纸

技术编号:9841102 阅读:263 留言:0更新日期:2014-04-02 04:14
本发明专利技术公开了一种区分地域性口音的语音数据识别方法和装置。所述区分地域性口音的语音数据识别方法包括:计算语音数据的语音识别置信度和/或信噪比,并根据语音识别置信度和/或信噪比从语音数据中筛选出地域性语音数据;根据所述地域性语音数据的地域属性确定所述地域性语音数据的所属地域。本发明专利技术公开的区分地域性口音的语音数据识别方法和装置通过计算语音数据的置信度和信噪比将地域性语音数据自动的从海量的语音数据中识别出来,避免了对语音数据进行人工标注,提高了语音数据处理的效率。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种区分地域性口音的语音数据识别方法和装置。所述区分地域性口音的语音数据识别方法包括:计算语音数据的语音识别置信度和/或信噪比,并根据语音识别置信度和/或信噪比从语音数据中筛选出地域性语音数据;根据所述地域性语音数据的地域属性确定所述地域性语音数据的所属地域。本专利技术公开的区分地域性口音的语音数据识别方法和装置通过计算语音数据的置信度和信噪比将地域性语音数据自动的从海量的语音数据中识别出来,避免了对语音数据进行人工标注,提高了语音数据处理的效率。【专利说明】区分地域性口音的语音数据识别方法和装置
本专利技术涉及语音数据处理
,尤其涉及一种区分地域性口音的语音数据识别方法和装置。
技术介绍
我国幅员辽阔,这使得汉语中包含地域性口音的方言的种类众多。来自不同地方的方言在发音特点,语速特点上各不相同。所以,采用相同的声学模型对不同地方的方言进行语音识别时,会出现识别准确率不高的现象。为了解决采用统一的适用于汉语普通话的声学模型对不同地方方言进行语音识别时识别准确率不高的问题,针对不同地方的方言分别训练为各种方言定制的声学模型是一种很好的途径。训练声学模型需要海量的训练数据。目前,随着微信、米聊等即时通讯工具的流行,互联网上存储有大量的原始语音数据。这些语音数据可以作为训练针对不同地方方言的声学模型的训练数据。但是,现有技术中,没有从这些语音数据中区分哪些是普通话的语音数据,哪些是地域性语音数据的自动化方法,使得要使用原始语音数据训练针对地方方言的声学模型之前,首先需要对这些原始语音数据人工标注出地域标签,这会耗费大量人力物力。
技术实现思路
本专利技术实施例提出一种区分地域性口音的语音数据识别方法和装置,以从原始语音数据中自动识别出地域性语音数据。第一方面,本专利技术实施例提供了一种区分地域性口音的语音数据识别方法,所述方法包括:计算语音数据的语音识别置信度和/或信噪比,并根据语音识别置信度和/或信噪比从语音数据中筛选出地域性语音数据;根据所述地域性语音数据的地域属性确定所述地域性语音数据的所属地域。第二方面,本专利技术实施例提供了一种区分地域性口音的语音数据识别装置,所述装置包括:语音数据筛选模块,用于计算语音数据的语音识别置信度和/或信噪比,并根据语音识别置信度和/或信噪比从语音数据中筛选出地域性语音数据;地域确定模块,用于根据所述地域性语音数据的地域属性确定所述地域性语音数据的所属地域。本专利技术实施例提供的区分地域性口音的语音数据识别方法和装置,通过计算语音数据的置信度和/或信噪比,将地域性语音数据自动的从海量的语音数据中筛选出来,减少了对全部语音数据进行人工标注的工作量,提高了语音数据处理的效率。【专利附图】【附图说明】通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1是本专利技术第一实施例提供的区分地域性口音的语音数据识别方法的流程图;图2是本专利技术第一实施例提供的区分地域性口音的语音数据识别方法的信号流图;图3是本专利技术第二实施例提供的区分地域性口音的语音数据识别方法的流程图;图4是本专利技术第二实施例提供的区分地域性口音的语音数据识别方法中信噪比计算的流程图;图5是本专利技术第二实施例提供的区分地域性口音的语音数据识别方法的信号流图;图6是本专利技术第三实施例提供的区分地域性口音的语音数据识别装置的结构图。【具体实施方式】下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。图1及图2示出了本专利技术的第一实施例。图1是本专利技术第一实施例提供的区分地域性口音的语音数据识别方法的流程图。参见图1,所述区分地域性口音的语音数据识别方法包括:S110,计算语音数据的语音识别置信度和/或信噪比,并根据语音识别置信度和/或信噪比从语音数据中筛选出地域性语音数据。因为现有技术中用于语音识别的声学模型都是针对低噪音并且没有地域性口音的标准普通话语音训练的声学模型。当使用这些声学模型来对地域性语音数据进行语音识别时,会出现语音识别置信度不高,进而语音识别的识别率不高的情况。正因为地域性语音数据有进行语音识别时语音识别置信度不高的特征,所以可以计算地域性语音数据的语音识别置信度,再根据计算的地域性语音数据的语音识别置信度筛选出地域性语音数据。然而,造成语音数据的语音识别置信度不高的原因也可能是因为语音数据中有较高的噪声。所述还可以通过计算语音数据的信噪比,将语音数据中信噪比较低的语音数据滤除,以清除由于低信噪比造成其语音识别置信度低的语音数据。将语音数据中信噪比较低的语音数据清除以后,剩下的语音数据就是由于地域性口音造成语音识别置信度不高的语音数据,也即地域性语音数据。在本实施例中,通过计算语音数据的语音识别置信度和/或信噪比,并根据语音识别置信度和/或信噪比从语音数据中筛选出地域性语音数据。需要说明的是,可以同时计算语音数据的语音识别置信度以及信噪比,根据计算得到的语音识别置信度和信噪比从语音数据中筛选出地域性语音数据,也可以单独计算语音数据的语音识别置信度或信噪t匕,根据计算得到的语音识别置信度或信噪比从语音数据中筛选出地域性语音数据。S120,根据所述地域性语音数据的地域属性确定所述地域性语音数据的所属地域。从语音数据中筛选出地域性语音数据后,对筛选得到的地域性语音数据确定所述地域性语音数据的所属地域。对所述地域性语音数据确定其所属地域需要根据所述地域性语音数据的地域属性来确定所述地域性语音数据的所述地域。优选的,所述地域属性包括所述语音数据的来源IP地址的归属地,或者所述语音数据的来源用户的归属地。由于首先从海量语音数据中进行了筛选,所以基于地域属性进行地域标注的计算量在一定程度上有所减少,也使得此地域区分的准确性有所提高。图2是本专利技术第一实施例提供的区分地域性口音的语音数据识别方法的信号流图。参见图2,语音数据输入至置信度和/或信噪比分类器201以根据语音识别置信度和/或信噪比对所述语音数据进行分类,将根据语音识别置信度和/或信噪比分类后的语音数据输入至地域属性分类器202以根据语音数据的地域属性对所述语音数据进行分类,最后得到按照地域属性进行分类后的地域性语音数据。本实施例通过计算语音数据的语音识别置信度和/或信噪比,从海量的语音数据中筛选地域性语音数据,实现了从海量的语音数据中自动识别地域性语音数据,减少了对海量语音数据进行人工标注的工作量,也提高了语音数据处理的效率。图3至图5示出了本专利技术的第二实施例。图3是本专利技术第二实施例提供的区分地域性口音的语音数据识别方法的流程图。所述区分地域性口音的语音数据识别方法以上述实施例为基础,进一步的,计算语音数据的语音识别置信度和/或信噪比,并根据语音识别置信度和/或信噪比从语音数据中筛选出地域性语音数据包括:计算语音数据的语音识别置信度,选取所述语音识别置信度的取值范围居中的语音数据;计算选取的语音数据的信噪比,并将信噪比大于设定阈值的语音数据作为地域性语音数据。参见图3,所述区分地域性口音的语音数据识别方法包括:S310,计算语音数据的语音识别本文档来自技高网
...

【技术保护点】
一种区分地域性口音的语音数据识别方法,其特征在于,包括:计算语音数据的语音识别置信度和/或信噪比,并根据语音识别置信度和/或信噪比从语音数据中筛选出地域性语音数据;根据所述地域性语音数据的地域属性确定所述地域性语音数据的所属地域。

【技术特征摘要】

【专利技术属性】
技术研发人员:苏丹尹钊
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1