The embodiment of the invention discloses a method and device for improving the accuracy of speech recognition. The method includes: obtaining the voice information from the user terminal and obtaining the network information of the user's family network according to the telephone number of the user terminal, obtaining the telephone number of the relatives of each user satisfying the preset conditions according to the network information of the user's family network, and obtaining the telephone number of the individual users. According to the home information of the telephone number of the relatives, the target location is obtained, and the target acoustic model and the language model are determined according to the destination of the target, and the speech information is translated into text information according to the target acoustic model and the language model. The device is used to implement the method, and the method of improving the accuracy rate of speech recognition by the embodiment of the invention can improve the accuracy of the acoustic model and the language model, and then improve the accuracy of speech recognition.
【技术实现步骤摘要】
一种提高语音识别准确率的方法及装置
本专利技术属于通信
,具体涉及一种提高语音识别准确率的方法及装置。
技术介绍
随着语音识别技术的发展,基于语音识别技术的应用层出不穷。尤其是在通信领域,各大通信运营商均推出了基于语音识别技术的应用以及业务。而对语音识别的准确率,直接关系到该应用或业务能否取得成功。一般地,提升语音识别准确率的方式主要有以下几种:1、优化声学模型:该方法通过计算语音到音节的概率,得到最优的语音与音节的对应关系。目前,声学模型主要基于隐马尔可夫(HiddenMarkovModel,HMM)的框架进行声学建模。隐马尔可夫模型技术的成熟和不断完善使之成为主流方法,而通过寻找其他方式进一步优化声学模型是非常困难的。2、优化语言模型:该方法主要根据规则和统计的方式建立音节与字的关系,通过用概率统计的方法来揭示语音单位内在的统计规律。当前,被广泛使用且简单有效的是N-gram模型。3、训练通用语言和声学模型:该方法通过收集大量的语音文件,增加模型的训练数据,通过机器学习后得到一个通用的语言和声学模型。然而,我国幅员辽阔,文化和语言种类众多,即使是国家通用的普通话,也夹杂着当地的方言口音和文化表达。因此,通用模型很难保持稳定的语音识别准确率。4、训练专项语言和声学模型:该方法根据实际的场景需要,通过训练一部分语音、语料以建立一个专用语言和声学模型。然而,此方式只能满足小部分人的需求,很难推广使用。上述现有的通过模型算法优化,或者根据数据源大小训练得到不同模型的方式,存在以下问题:不能针对用户的说话系统进行个性化定制优化:由于每个地区用户的语音表述都 ...
【技术保护点】
1.一种提高语音识别准确率的方法,其特征在于,包括:获取来自用户终端的语音信息,并根据所述用户终端的电话号码,获取用户的亲情网组网信息;根据所述用户的亲情网组网信息,获取满足预设条件的各亲情用户的电话号码,并获取所述各亲情用户的电话号码的归属地信息;根据所述各亲情用户的电话号码的归属地信息,获取目标归属地,并根据所述目标归属地,确定目标声学模型以及语言模型;根据所述目标声学模型以及语言模型,将所述语音信息转写成文本信息。
【技术特征摘要】
1.一种提高语音识别准确率的方法,其特征在于,包括:获取来自用户终端的语音信息,并根据所述用户终端的电话号码,获取用户的亲情网组网信息;根据所述用户的亲情网组网信息,获取满足预设条件的各亲情用户的电话号码,并获取所述各亲情用户的电话号码的归属地信息;根据所述各亲情用户的电话号码的归属地信息,获取目标归属地,并根据所述目标归属地,确定目标声学模型以及语言模型;根据所述目标声学模型以及语言模型,将所述语音信息转写成文本信息。2.根据权利要求1所述的方法,其特征在于,所述预设条件包括:与所述用户的年龄差达到一定阈值;和/或年龄超过预设值。3.根据权利要求1所述的方法,其特征在于,所述根据所述各亲情用户的电话号码的归属地信息,获取目标归属地包括:若所述各亲情用户的电话号码的归属地一致,则将所述归属地作为目标归属地;若所述各亲情用户的电话号码的归属地不一致,则选取所述归属地中对应所述亲情用户的电话号码的数量最多的归属地作为目标归属地。4.根据权利要求3所述的方法,其特征在于,所述根据所述各亲情用户的电话号码的归属地信息,获取目标归属地还包括:若所述各亲情用户的电话号码的归属地不一致,则将所述各亲情用户中,年龄最大的用户对应的归属地作为目标归属地。5.根据权利要求1所述的方法,其特征在于,所述根据所述目标归属地,确定目标声学模型以及语言模型包括:判断与所述目标归属地对应的声学模型以及语言模型是否存在,若存在,则将该声学模型以及语言模型作为目标声学模型以及语言模型;若不存在,则将通用的声学模型以及语言模型作为目标声学模型以及...
【专利技术属性】
技术研发人员:叶勇,申宗杰,方国梁,
申请(专利权)人:中国移动通信集团浙江有限公司,中国移动通信集团公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。