一种基于姓氏的语音识别系统及方法技术方案

技术编号:18085510 阅读:29 留言:0更新日期:2018-05-31 14:01
本发明专利技术公开了一种基于姓氏的语音识别系统及方法,包括主控制单元、语音获取单元、语音处理单元、姓氏模型单元和预训练单元:所述主控制单元分别连接语音获取单元、语音处理单元、姓氏模型单元和预训练单元,本发明专利技术不仅简单便捷,有效地实现高准确率快速姓氏汉字的识别,同时针对姓氏多种易混淆的可能设计一系列的处理方式,提高了语音识别的性能以及识别率,减轻了系统计算负担。

【技术实现步骤摘要】
一种基于姓氏的语音识别系统及方法
本专利技术涉及语音识别
,尤其涉及一种基于姓氏的语音识别系统及方法。
技术介绍
语言是人类相互交流最常用、最有效、最重要和最方便的通信形式,语音是语言的声学表现,与机器进行语音交流是人类一直以来的梦想。随着计算机技术的飞速发展,语音识别技术也取得突破性的成就,人与机器用自然语言进行对话的梦想逐步接近实现。语音识别技术的应用范围极为广泛,不仅涉及到日常生活的方方面面,在军事领域也发挥着极其重要的作用。它是信息社会朝着智能化和自动化发展的关键技术,使人们对信息的处理和获取更加便捷,从而提高人们的工作效率。
技术实现思路
本专利技术的目的在于提供一种基于姓氏的语音识别系统及方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于姓氏的语音识别系统,包括主控制单元、语音获取单元、语音处理单元、姓氏模型单元和预训练单元:所述主控制单元分别连接语音获取单元、语音处理单元、姓氏模型单元和预训练单元。作为本专利技术的进一步技术方案:所述语音获取单元为M6027麦克风。作为本专利技术的进一步技术方案:所述语音处理单元分为声学模型特征提取模块、语言模型特征提取模块、混淆处理模块和单双姓氏处理模块。一种基于姓氏的语音识别方法,包含以下步骤:A、用户输入一串语音;B、系统获取语音信号,通过声学模型对语音进行特征提取,在声学模型得出发音序列后,利用语言模型从候选文字序列中找出概率最大的字符串序列;C、从汉字字符串序列中提取出表示姓氏的汉字,通过收集的全部汉字及其拼音字典,可将汉字转换为拼音,若其为多音字,只转换为其中某一个拼音;D、如果该姓氏为单字姓氏,则将其拼音加入列表list,针对姓氏拼音做易混淆发音的处理,以及查找多音字的处理,并将结果全部保存到list中;E、如果该姓氏为双字姓氏,则将两字姓氏中每个字的拼音单独取出进行易混淆发音的处理及查找多音,每个字都可得一个列表,将两个列表进行两两任意组合,找出这些拼音组合对应所有姓氏;F、根据得到的拼音列表,可查找到每个拼音对应的姓氏汉字,列出说话人所表达的全部可能姓氏汉字;G、最终获取对应姓氏汉字列表。与现有技术相比,本专利技术的有益效果是:本专利技术不仅简单便捷,有效地实现高准确率快速姓氏汉字的识别,同时针对姓氏多种易混淆的可能设计一系列的处理方式,提高了语音识别的性能以及识别率,减轻了系统计算负担。附图说明图1是一种基于姓氏的语音识别系统的结构框图图2是一种基于姓氏的语音识别方法的流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1-2,本专利技术实施例中,一种基于姓氏的语音识别系统,其包括语音获取单元、语音处理单元、姓氏模型单元和预训练单元。语音获取单元:该单元负责利用M6027麦克风对用户发出的命令进行语音信号采样,并将用户语音信号传送至语音处理单元进行处理,使其通过语音识别,转换为汉字字符串。语音处理单元:单元分为声学模型特征提取模块、语言模型特征提取模块、混淆处理模块和单双姓氏处理模块。其中声学模型特征提取模块是利用声学模型对语音信号进行特征提取,将语音转换为声学表示的输出,给出语音是属于某个声学符号的概率;语言模型特征提取模块是在声学模型给出发音序列后,从候选文字序列中找出概率最大的字符串序列;混淆处理模块中有四种处理形式,一为平舌音和翘舌音处理,针对姓氏的拼音,判断是否以z、s或者c开头,若以z、s或者c开头,继续判断拼音中是否存在h,若存在,则去掉;若不存在,则在拼音的第二个位置加上h;二为前鼻音和后鼻音处理,对于后鼻音:字母g一般出现在拼音的开头或者结尾,判断姓氏拼音中是否包含ang、eng或者ing,若包含,则去掉拼音结尾的g,对于前鼻音:an、en和in一般出现在拼音的结尾,判断姓氏拼音中是否存在an、en或者in,若存在,继续判断拼音的最后一位是否为g,若不是,则在拼音的结尾加上g。三为鼻音n和边音l处理,判断姓氏拼音的开头是否为n,若为n,则将开头的n换为l。判断拼音的开头是否为l,若为l,则开头的l换为n;四为多音字处理,在将姓氏汉字转换为拼音的过程,若用户说出的姓氏为多音字,且其并未按照多音字在姓氏中的正确拼音读出,系统根据35个多音字的正确姓氏发音和其他发音的列表,判断所输入拼音是否在其他发音中,若在其他发音中,则取出正确姓氏发音。35个多音字的正确姓氏发音和其他发音的列表通过是系统已有的全部汉字及其拼音的列表中找出姓氏中的所有多音字,其中单字姓氏中有28个多音字,双字姓氏中有7个多音字。单双姓氏处理模块,其中对于单姓氏,先将单字姓氏的拼音加入列表list,针对姓氏拼音做易混淆发音的处理,以及查找多音字的处理,并将结果全部保存到list中。而对于双姓氏,将两字姓氏中每个字的拼音单独取出进行易混淆发音的处理及查找多音,每个字都可得一个列表,将两个列表进行两两任意组合,找出这些拼音组合对应所有姓氏。姓氏模型单元:收集的全部汉字及其拼音字典,其要覆盖尽可能多的汉字,并以此构建姓氏模型。预训练单元:通过系统构建的构建姓氏模型进行预先训练提取姓氏的识别模式,进行姓氏汉字的提取。本专利技术的工作原理是:其工作流程如图2所示:1.用户输入一串语音。2.系统获取语音信号,通过声学模型对语音进行特征提取,在声学模型得出发音序列后,利用语言模型从候选文字序列中找出概率最大的字符串序列。3.从汉字字符串序列中提取出表示姓氏的汉字,通过收集的全部汉字及其拼音字典,可将汉字转换为拼音,若其为多音字,只转换为其中某一个拼音。4.如果该姓氏为单字姓氏,则将其拼音加入列表list,针对姓氏拼音做易混淆发音的处理,以及查找多音字的处理,并将结果全部保存到list中。5.如果该姓氏为双字姓氏,则将两字姓氏中每个字的拼音单独取出进行易混淆发音的处理及查找多音,每个字都可得一个列表,将两个列表进行两两任意组合,找出这些拼音组合对应所有姓氏。6.根据得到的拼音列表,可查找到每个拼音对应的姓氏汉字,列出说话人所表达的全部可能姓氏汉字。7.最终获取对应姓氏汉字列表。本文档来自技高网...
一种基于姓氏的语音识别系统及方法

【技术保护点】
一种基于姓氏的语音识别系统,包括主控制单元、语音获取单元、语音处理单元、姓氏模型单元和预训练单元:其特征在于,所述主控制单元分别连接语音获取单元、语音处理单元、姓氏模型单元和预训练单元。

【技术特征摘要】
1.一种基于姓氏的语音识别系统,包括主控制单元、语音获取单元、语音处理单元、姓氏模型单元和预训练单元:其特征在于,所述主控制单元分别连接语音获取单元、语音处理单元、姓氏模型单元和预训练单元。2.根据权利要求1所示的一种基于姓氏的语音识别系统,其特征在于,所述语音获取单元为M6027麦克风。3.根据权利要求1所示的一种基于姓氏的语音识别系统,其特征在于,所述语音处理单元分为声学模型特征提取模块、语言模型特征提取模块、混淆处理模块和单双姓氏处理模块。4.一种基于姓氏的语音识别方法,其特征在于,包含以下步骤:A、用户输入一串语音;B、系统获取语音信号,通过声学模型对语音进行特征提取,在声学模型得出发音序列后,利用...

【专利技术属性】
技术研发人员:徐东群庄永军
申请(专利权)人:深圳市三宝创新智能有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1