当前位置: 首页 > 专利查询>杨捷专利>正文

一种鸟类语音识别系统技术方案

技术编号:6894028 阅读:618 留言:0更新日期:2012-04-11 18:40
本实用新型专利技术公开了一种鸟类语音识别系统,包括机壳,还包括装设在机壳内的数据预处理、语音识别模块,与该数据预处理、语音识别模块输入端连接的数据采集装置,与该数据预处理、语音识别模块输出端连接的语音识别结果输出模块。有效消除了鸟类叫声中可能混杂的不同程度的背景噪声,并利用压缩感知理论的分类模型对得到的鸟类叫声进行模式匹配,提高了语音识别的精确度,体积较小,便于随身携带,具备鸟类语音录制和识别功能,此外还可利用提供的USB接口将对应的音频文件存储到相关的存储设备上。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本技术涉及一种鸟类语音识别系统
技术介绍
林地是构成地球表面植被的重要组成部分,而鸟类是林地生态系统的核心成员。 爱护鸟类,保护环境,促进人与自然环境的和谐发展,是我国的一项基本国策。为增强爱护鸟类的自觉性,有效促进鸟类知识的普及,我们非常有必要研究出一套基于鸟类语音叫声的自动识别系统。在传统的鸟类观测中,人们往往不容易接近鸟类,尤其是一些珍惜物种; 而如果考虑到不干涉鸟类的正常生活习性,在较远距离下观察又不容易得到正确的信息。 鸟类语音识别,就是一种保持相应范围的前提下,专门针对鸟类叫声为研究对象的语音识别技术。其主要过程是通过语音记录设备,获取某种未知鸟类的叫声,通过对该类声音的分析判断,从而获得对该种鸟类正确的信息。这样即可以实现对鸟类的基本信息获取,又有效地保护了鸟类的生活习性和特定。现有的语音识别技术可大致分为几个部分(1)特征提取从语音信号中提取反应其本质特征的声学特征;(2)模型建立通过已知语音样本中的声学特征,利用指定的人工智能算法对其进行训练,目的是为每个已知类别的发音建立对应的唯一声学模型并将其保存;C3)模式匹配(识别算法)在识别的过程中,将输入的未知样本同声学模型进行相识度比较,而相识度最高者将作为结果输出。然而现有的语音识别技术往往是以人为研究对象,其语音声学模型通常为基于人类的声韵母或整词,而且大多是在静室(无噪声)情况下建立。考虑到鸟类语音识别系统的性能可能受许多外界因素的干扰,包括不同的鸟类叫声,背景噪音和传输信道等等,如果将现有的技术直接应用于鸟类语音识别,那么将会因为缺乏有效的消除噪声手段以及分类识别技术导致系统性能的下降。
技术实现思路
本技术的目的在于克服现有技术中的上述缺陷,提供一种用于采集未知鸟类的原始语音信号,并对所采集的鸟类的原始语音信号进行预处理、识别,消除背景噪声并提取鸟类声学特征,进而将其与已知的数据模型进行模式匹配,得到与该鸟类相关的具体信息的鸟类语音识别系统。为实现上述目的,本技术提供的技术方案如下提供一种鸟类语音识别系统, 包括机壳,还包括装设在机壳内的数据预处理、语音识别模块,与该数据预处理、语音识别模块输入端连接的数据采集装置,与该数据预处理、语音识别模块输出端连接的语音识别结果输出模块。本技术所述的一种鸟类语音识别系统的有益效果是通过构造一机壳,在机壳内装设有数据预处理、语音识别模块,该数据预处理、语音识别模块输入端与数据采集装置连接,该数据预处理、语音识别模块输出端与语音识别结果输出模块连接,有效消除了鸟类叫声中可能混杂的不同程度的背景噪声,并利用压缩感知理论的分类模型对得到的鸟类叫声进行模式匹配,提高了语音识别的精确度,体积较小,便于随身携带,具备鸟类语音录制和识别功能,此外还可利用提供的USB接口将对应的音频文件存储到相关的存储设备上。以下结合附图和实施例对本技术所述的一种鸟类语音识别系统作进一步说明。附图说明图1是本技术所述的一种鸟类语音识别系统的结构示意图;图2是本技术所述的一种鸟类语音识别系统的结构原理图;图3是本技术所述的一种鸟类语音识别系统的控制流程框图。具体实施方式以下本技术所述一种鸟类语音识别系统的最佳实例,并不因此限定本技术的保护范围。参照图1、图2、图3,提供一种鸟类语音识别系统,包括机壳1,还包括装设在机壳 1内的数据预处理、语音识别模块2,与该数据预处理、语音识别模块2输入端连接的数据采集装置3,与该数据预处理、语音识别模块2输出端连接的语音识别结果输出模块4。所述数据预处理、语音识别模块2是由中央处理器CPU、电源管理电路、大容量存储器构成,用于对原始语音进行预处理,消除噪声带来的影响,从而使之后处理后得到的声学特征更能反映鸟类叫声的本质特征,并对得到的信号的声学特征和数据库样本进行匹配,并做出识别判断。所述数据采集装置3是麦克风,该麦克风装设在机壳1上,用来获取外界鸟类的原始语音信号。所述语音识别结果输出模块4是由装设在机壳1上的USB接口、扬声器、IXD显示屏构成,用于将得到的识别结果(鸟类信息)按照指定格式和形式输出到用户端并进行保存。所述压缩感知理论是斯坦福大学的Candes教授在2006年提出并得到广泛推广, 其基本思想是一个采集原始信号经过非自适应的线性投影后,可以根据相应重构算法由测量值重建立原始信号。压缩传感的优点在于信号的投影数据量远远小于传统采样方法所需求的数据量,这样使得高分辨率信号的采集不再依赖传统的香农采样定理,使得稀疏表示成为可能。在应用压缩感知模型进行鸟类语音识别的过程当中,不失一般性,下面假设收集到的鸟类声学特征为向量,那么我们利用已知的鸟类叫声数据库当中的数据作为测量矩阵(De^Tx",(其中m为信号维数,η为已知的样本数量),那么压缩感知理论给出了当y和Φ在满足一定条件下,可以通过测量值y通过求解向量的最优Itl范数(向量中非零元素的个数)来构造一个稀疏信号s,即§ = argmin|4s.t.y = Φ8ο接下来再通过分析该稀疏信号s在每类鸟叫声样本中的能量分布,我们可以取最大能量的那类样本作为识别结果。上述实施例为本技术较佳的实施方式,但本技术的实施方式并不受上述实施例的限制,其他的任何未背离本技术的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本技术的保护范围之内。权利要求1.一种鸟类语音识别系统,包括机壳(1),其特征在于,还包括装设在机壳(1)内的数据预处理、语音识别模块O),与该数据预处理、语音识别模块( 输入端连接的数据采集装置(3),与该数据预处理、语音识别模块( 输出端连接的语音识别结果输出模块G)。2.根据权利要求1所述的一种鸟类语音识别系统,其特征在于,所述数据预处理、语音识别模块( 是由中央处理器CPU、电源管理电路、大容量存储器构成。3.根据权利要求1所述的一种鸟类语音识别系统,其特征在于,所述数据采集装置(3) 是麦克风(9),该麦克风(9)装设在机壳(1)上。4.根据权利要求1所述的一种鸟类语音识别系统,其特征在于,所述语音识别结果输出模块⑷是由装设在机壳⑴上的USB接口(6)、扬声器(7)、LCD显示屏⑶构成。专利摘要本技术公开了一种鸟类语音识别系统,包括机壳,还包括装设在机壳内的数据预处理、语音识别模块,与该数据预处理、语音识别模块输入端连接的数据采集装置,与该数据预处理、语音识别模块输出端连接的语音识别结果输出模块。有效消除了鸟类叫声中可能混杂的不同程度的背景噪声,并利用压缩感知理论的分类模型对得到的鸟类叫声进行模式匹配,提高了语音识别的精确度,体积较小,便于随身携带,具备鸟类语音录制和识别功能,此外还可利用提供的USB接口将对应的音频文件存储到相关的存储设备上。文档编号G10L15/20GK202058443SQ20112014469公开日2011年11月30日 申请日期2011年5月9日 优先权日2011年5月9日专利技术者周宇翔, 杨捷 申请人:周宇翔, 杨捷本文档来自技高网
...

【技术保护点】
1.一种鸟类语音识别系统,包括机壳(1),其特征在于,还包括装设在机壳(1)内的数据预处理、语音识别模块(2),与该数据预处理、语音识别模块(2)输入端连接的数据采集装置(3),与该数据预处理、语音识别模块(2)输出端连接的语音识别结果输出模块(4)。

【技术特征摘要】

【专利技术属性】
技术研发人员:杨捷周宇翔
申请(专利权)人:杨捷周宇翔
类型:实用新型
国别省市:83

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1