一种提高语音识别准确率的方法及装置制造方法及图纸

技术编号:18459718 阅读:31 留言:0更新日期:2018-07-18 13:04
本发明专利技术实施例公开一种提高语音识别准确率的方法及装置。所述方法包括:获取来自用户终端的语音信息,并根据所述用户终端的电话号码,获取用户的亲情网组网信息;根据所述用户的亲情网组网信息,获取满足预设条件的各亲情用户的电话号码,并获取所述各亲情用户的电话号码的归属地信息;根据所述各亲情用户的电话号码的归属地信息,获取目标归属地,并根据所述目标归属地,确定目标声学模型以及语言模型;根据所述目标声学模型以及语言模型,将所述语音信息转写成文本信息。所述装置用于实现所述方法,本发明专利技术实施例提供的提高语音识别准确率的方法,可提高声学模型和语言模型适用的准确率,进而提高语音识别的准确率。

Method and device for improving accuracy of speech recognition

The embodiment of the invention discloses a method and device for improving the accuracy of speech recognition. The method includes: obtaining the voice information from the user terminal and obtaining the network information of the user's family network according to the telephone number of the user terminal, obtaining the telephone number of the relatives of each user satisfying the preset conditions according to the network information of the user's family network, and obtaining the telephone number of the individual users. According to the home information of the telephone number of the relatives, the target location is obtained, and the target acoustic model and the language model are determined according to the destination of the target, and the speech information is translated into text information according to the target acoustic model and the language model. The device is used to implement the method, and the method of improving the accuracy rate of speech recognition by the embodiment of the invention can improve the accuracy of the acoustic model and the language model, and then improve the accuracy of speech recognition.

【技术实现步骤摘要】
一种提高语音识别准确率的方法及装置
本专利技术属于通信
,具体涉及一种提高语音识别准确率的方法及装置。
技术介绍
随着语音识别技术的发展,基于语音识别技术的应用层出不穷。尤其是在通信领域,各大通信运营商均推出了基于语音识别技术的应用以及业务。而对语音识别的准确率,直接关系到该应用或业务能否取得成功。一般地,提升语音识别准确率的方式主要有以下几种:1、优化声学模型:该方法通过计算语音到音节的概率,得到最优的语音与音节的对应关系。目前,声学模型主要基于隐马尔可夫(HiddenMarkovModel,HMM)的框架进行声学建模。隐马尔可夫模型技术的成熟和不断完善使之成为主流方法,而通过寻找其他方式进一步优化声学模型是非常困难的。2、优化语言模型:该方法主要根据规则和统计的方式建立音节与字的关系,通过用概率统计的方法来揭示语音单位内在的统计规律。当前,被广泛使用且简单有效的是N-gram模型。3、训练通用语言和声学模型:该方法通过收集大量的语音文件,增加模型的训练数据,通过机器学习后得到一个通用的语言和声学模型。然而,我国幅员辽阔,文化和语言种类众多,即使是国家通用的普通话,也夹杂着当地的方言口音和文化表达。因此,通用模型很难保持稳定的语音识别准确率。4、训练专项语言和声学模型:该方法根据实际的场景需要,通过训练一部分语音、语料以建立一个专用语言和声学模型。然而,此方式只能满足小部分人的需求,很难推广使用。上述现有的通过模型算法优化,或者根据数据源大小训练得到不同模型的方式,存在以下问题:不能针对用户的说话系统进行个性化定制优化:由于每个地区用户的语音表述都会具有不同的本地特色,因此,基于上线数据来对上线声学模型和语言模型进行自适应优化,虽然整体的优化方案通用性比较好,但是针对地域差异性明显或者发音比较独特的用户群体,其很难保持比较准确的识别效果。即便现有技术中为各地域各口音的用户群体建立了不同的声学和语言模型,但在实际应用时,并不能快速准确地确认用户所在的地域或者口音类别,使得声学和语言模型适用错误。因此,如何提出一种方法,可提高声学模型和语言模型适用的准确率,进而提高语音识别的准确率,具有十分重要的意义。
技术实现思路
针对现有技术中的缺陷,本专利技术实施例提供一种提高语音识别准确率的方法及装置。一方面,本专利技术实施例提出一种提高语音识别准确率的方法,包括:获取来自用户终端的语音信息,并根据所述用户终端的电话号码,获取用户的亲情网组网信息;根据所述用户的亲情网组网信息,获取满足预设条件的各亲情用户的电话号码,并获取所述各亲情用户的电话号码的归属地信息;根据所述各亲情用户的电话号码的归属地信息,获取目标归属地,并根据所述目标归属地,确定目标声学模型以及语言模型;根据所述目标声学模型以及语言模型,将所述语音信息转写成文本信息。本专利技术实施例提供的提高语音识别准确率的方法,由于可根据用户亲情网中的亲情用户的电话号码的归属地作为目标归属地,并根据目标归属地确定对应的声学模型以及语言模型,因此可避免例如用户因为在外工作而导致的声学模型以及语言模型适用错误的情况,能显著提高声学模型和语言模型适用的准确率,进而提高语音识别的准确率。另一方面,本专利技术实施例提出一种提高语音识别准确率的装置,包括:信息获取模块,用于获取来自用户终端的语音信息,并根据所述用户终端的电话号码,获取用户的亲情网组网信息;归属地获取模块,用于根据所述用户的亲情网组网信息,获取满足预设条件的各亲情用户的电话号码,并获取所述各亲情用户的电话号码的归属地信息;语言模型确定模块,用于根据所述各亲情用户的电话号码的归属地信息,获取目标归属地,并根据所述目标归属地,确定目标声学模型以及语言模型;语音转写模块,用于根据所述目标声学模型以及语言模型,将所述语音信息转写成文本信息。本专利技术实施例提供的提高语音识别准确率的装置,由于可根据用户亲情网中的亲情用户的电话号码的归属地作为目标归属地,并根据目标归属地确定对应的声学模型以及语言模型,因此可避免例如用户因为在外工作而导致的声学模型以及语言模型适用错误的情况,能显著提高声学模型和语言模型适用的准确率,进而提高语音识别的准确率。附图说明图1为本专利技术提高语音识别准确率的方法实施例的流程示意图;图2为本专利技术提高语音识别准确率的装置实施例的流程示意图;图3为本专利技术提高语音识别准确率的装置的结构框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术提高语音识别准确率的方法实施例的流程示意图,参看图1,本实施例公开一种提高语音识别准确率的方法,包括:S1、获取来自用户终端的语音信息,并根据所述用户终端的电话号码,获取用户的亲情网组网信息;S2、根据所述用户的注册信息,获取满足预设条件的各亲情用户的电话号码,并获取所述各亲情用户的电话号码的归属地信息;S3、根据所述各亲情用户的电话号码的归属地信息,获取目标归属地,并根据所述目标归属地,确定目标声学模型以及语言模型;S4、根据所述目标声学模型以及语言模型,将所述语音信息转写成文本信息。本专利技术实施例提供的提高语音识别准确率的方法,由于可根据用户亲情网中的亲情用户的电话号码的归属地作为目标归属地,并根据目标归属地确定对应的声学模型以及语言模型,因此可避免例如用户因为在外工作而导致的声学模型以及语言模型适用错误的情况,能显著提高声学模型和语言模型适用的准确率,进而提高语音识别的准确率。需要说明的是,本方法实施例的执行主体为服务器。具体地,在步骤S1中,当用户终端在进行语音通话时,服务器获取来自用户终端的语音信息,并可对该语音信息进行预处理,例如将该语音信息中的静音部分去除。同时,服务器还可根据用户终端的电话号码,通过CRM(CustomerRelationshipManagement,用户关系管理)系统获取用户的亲情网组网信息。所述亲情网组网信息包括组网内各亲情用户的注册信息以及归属地信息。需要说明的是,所述亲情网指通信运营商为用户提供的一项话务服务:用户可建立亲情网组网,并将其他用户加入到组网中,在组网中的用户即为亲情用户。通常,亲情用户与建立亲情网组网的用户关系紧密,例如家庭关系等。常见的亲情网业务有中国移动亲情网,天翼亲情网等。在步骤S2中,所述预设条件包括:与所述用户的年龄差达到一定阈值;和/或年龄超过预设值。可以理解的是,与所述用户的年龄差达到一定阈值例如22的亲情用户,与所述用户的关系通常为父子关系或母子关系。而年龄超过预设值例如65,则通常为保持鲜明口音特征的老年人。通过设置这样的预设条件,即可筛选出与所述用户口音特征相同或至少相似的亲情用户。可选地,服务器可获取在传统节假日期间,所述用户与各亲情用户的通话频次和通话时长,以及从BOSS(Business&OperationSupportSystem,业务运营支撑系统)系统中获取所述用户与各亲情用户的支付关系,从而进一步确认所述用户与各亲情用户本文档来自技高网
...

【技术保护点】
1.一种提高语音识别准确率的方法,其特征在于,包括:获取来自用户终端的语音信息,并根据所述用户终端的电话号码,获取用户的亲情网组网信息;根据所述用户的亲情网组网信息,获取满足预设条件的各亲情用户的电话号码,并获取所述各亲情用户的电话号码的归属地信息;根据所述各亲情用户的电话号码的归属地信息,获取目标归属地,并根据所述目标归属地,确定目标声学模型以及语言模型;根据所述目标声学模型以及语言模型,将所述语音信息转写成文本信息。

【技术特征摘要】
1.一种提高语音识别准确率的方法,其特征在于,包括:获取来自用户终端的语音信息,并根据所述用户终端的电话号码,获取用户的亲情网组网信息;根据所述用户的亲情网组网信息,获取满足预设条件的各亲情用户的电话号码,并获取所述各亲情用户的电话号码的归属地信息;根据所述各亲情用户的电话号码的归属地信息,获取目标归属地,并根据所述目标归属地,确定目标声学模型以及语言模型;根据所述目标声学模型以及语言模型,将所述语音信息转写成文本信息。2.根据权利要求1所述的方法,其特征在于,所述预设条件包括:与所述用户的年龄差达到一定阈值;和/或年龄超过预设值。3.根据权利要求1所述的方法,其特征在于,所述根据所述各亲情用户的电话号码的归属地信息,获取目标归属地包括:若所述各亲情用户的电话号码的归属地一致,则将所述归属地作为目标归属地;若所述各亲情用户的电话号码的归属地不一致,则选取所述归属地中对应所述亲情用户的电话号码的数量最多的归属地作为目标归属地。4.根据权利要求3所述的方法,其特征在于,所述根据所述各亲情用户的电话号码的归属地信息,获取目标归属地还包括:若所述各亲情用户的电话号码的归属地不一致,则将所述各亲情用户中,年龄最大的用户对应的归属地作为目标归属地。5.根据权利要求1所述的方法,其特征在于,所述根据所述目标归属地,确定目标声学模型以及语言模型包括:判断与所述目标归属地对应的声学模型以及语言模型是否存在,若存在,则将该声学模型以及语言模型作为目标声学模型以及语言模型;若不存在,则将通用的声学模型以及语言模型作为目标声学模型以及...

【专利技术属性】
技术研发人员:叶勇申宗杰方国梁
申请(专利权)人:中国移动通信集团浙江有限公司中国移动通信集团公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1