声音识别方法和系统技术方案

技术编号:20162433 阅读:40 留言:0更新日期:2019-01-19 00:15
本申请提供一种声音识别方法和系统,该方法包括:实时获取声音,所述声音包括交通噪声;将所述声音转换为离散数字信号以及特征量;根据所述离散数字信号以及所述特征量实时优化深度学习神经网络模型;利用深度学习神经网络模型对所述声音进行识别。本申请的声音识别方法和系统,能够准确识别道路中出现的声音类型,并在识别过程中自动提高识别准确率。

【技术实现步骤摘要】
声音识别方法和系统
本申请涉及智能交通领域,尤其涉及一种声音识别方法和系统。
技术介绍
道路交通中,会产生许多不同的声音,随着智能交通技术的快速发展,对不同类型的声音进行及时而准确的识别就变得尤为重要。例如:(1)对机动车鸣喇叭声、非法改装跑车的发动机轰声的识别,有利于纠正违法行为,创建安静文明的城市交通环境。(2)对有警笛声的特种车辆的识别,有利于实现交通的智能疏导。(3)对货车、小客车、大客车和摩托车行驶噪声的识别,有利于交通噪声分布的研究。(4)对紧急刹车声、撞击声的识别,有利于交通事故的及时发现,尤其对于远离城市的高速公路。(5)其他情形的声音,例如爆炸声、强烈喊叫声,有利于突发事件的应急反应。但是,由于交通声音千变万化,不同类型的声音又具有非常相似的特性;而同一类别的声音也会有较大差异,例如喇叭声,不同型号的喇叭,或者安装在不同车辆上的相同喇叭,其声音特征也是千差万别,因此准确识别这些典型交通声音是非常困难的。当无法确定各个类型声音的统一特征时,声音识别的理论数学模型也难以确立。
技术实现思路
有鉴于此,本申请提供一种识别声音方法和系统,能够准确识别道路中出现的声音类型,并在识别过程中自动提高识别准确率。本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。根据本申请实施例的第一方面,提出一种声音识别方法,该方法包括:实时获取声音,所述声音包括交通噪声;将所述声音转换为离散数字信号以及特征量;根据所述离散数字信号以及所述特征量实时优化深度学习神经网络模型;利用深度学习神经网络模型对所述声音进行识别。在本申请的一种示例性实施例中,实时获取声音包括:实时采集环境声音;以及在所述环境声音满足第一条件时,实时获取所述声音。在本申请的一种示例性实施例中,将所述声音转换为离散数字信号以及特征量包括:通过模数转换器得到离散数字信号;通过数字信号处理提取所述声音的特征向量。在本申请的一种示例性实施例中,根据所述离散数字信号以及所述特征量实时优化深度学习神经网络模型,包括:将所述离散数字信号以及所述特征量输入深度学习神经网络模型;获取深度学习神经网络模型的输出向量,所述输出向量为所述声音与多个预定声音类型的相似度;根据所述输出向量确定所述声音的类型标签;根据所述离散数字信号、所述特征量以及所述样本标签优化深度学习神经网络模型。在本申请的一种示例性实施例中,根据所述输出向量确定所述声音的类型标签包括:当判断所述输出向量中每一个元素的极值大于或等于阈值时,确定所述声音的类型标签;当判断输出向量中每一个元素的数值均小于阈值时,确定所述声音的类型标签。在本申请的一种示例性实施例中,所述特征量包括下述特征中的至少一种:时域特征量;频域特征量;时频特征量。在本申请的一种示例性实施例中,还包括:根据深度学习神经网络模型的输出向量调整阈值。在本申请的一种示例性实施例中,利用深度学习神经网络模型对所述声音进行识别包括:将所述声音输入所述深度学习神经网络模型以获取相似度;根据所述相似度确定所述声音标签;其中,所述声音标签包括:喇叭声、警笛声、急刹声、撞击声、爆炸声、喊叫声。根据本申请实施例的第二方面,提出一种声音识别系统,包括:至少一个前端系统,用于实时采集环境声音;并将所述声音转换为离散数字信号以及特征量;利用深度学习神经网络模型对所述声音进行识别;以及后端云中心,用于根据所述离散数字信号以及所述特征量实时优化深度学习神经网络模型。在本申请的一种示例性实施例中,所述后端云中心还用于在判断深度学习神经网络模型的输出向量中每一个元素的极值大于或等于阈值时,确定所述声音的类型标签;以及在判断所述输出向量中每一个元素的数值均小于阈值时,确定所述声音的类型标签。根据本申请的声音识别方法和系统,能够准确识别道路中出现的声音类型,并在识别过程中自动提高识别准确率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。下面描述的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据一示例性实施例示出的一种声音识别方法的流程图。图2是根据一示例性实施例示出的一种声音识别方法的流程图。图3是根据一示例性实施例示出的一种声音识别方法的流程图。图4是根据一示例性实施例示出的一种声音识别系统的原理框图。图5是根据另一示例性实施例示出的一种声音识别系统的原理框图。图6是根据一示例性实施例示出的一种神经网络模型示意图。具体实施方式现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本专利技术将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本专利技术的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本专利技术的技术方案而省略特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本专利技术的各方面。附图仅为本专利技术的示意性图解,图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和步骤,也不是必须按所描述的顺序执行。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。下面结合附图对本专利技术示例实施方式进行详细说明。根据本申请的声音识别方法,能够准确识别道路中出现的声音类型,并在识别过程中自动提高识别准确率。图1是根据一示例性实施例示出的一种声音识别方法的流程图。参照图1,声音识别方法可以如下所示:在步骤S110中,实时获取声音,所述声音包括交通噪声。其中,可以在各个路口或交通噪声较多的地方安装声学采集模块以获取声音,例如声压传感器或多个按照一定形式固定的声压传感器组。声压传感器可用于感应空气中的声波,其能够感受声压并将声波转换成可用输出信号。根据示例实施例,步骤S110可以包括:实时采集环境声音;以及在所述环境声音满足第一条件时,实时获取所述声音。其中,第一条件可以指所述声音是否超过预定声级。当声波超过该预定声级时,认为所述声音属于交通噪声,触发声音样本的采集。在步骤S120中,将所述声音转换为离散数字信号以及特征量。其中,通过声压传感器或声压传感器组采集得到的声音形式可能为模拟信号。可以通过模数转换器将模拟信号转换为离散数字信号。离散数字信号是在连续信号上采样得到的离散信号。离散数字信号的转换方式通常包括:采样;离散化。根据示例本文档来自技高网...

【技术保护点】
1.一种声音识别方法,其特征在于,包括:实时获取声音,所述声音包括交通噪声;将所述声音转换为离散数字信号以及特征量;根据所述离散数字信号以及所述特征量实时优化深度学习神经网络模型;利用深度学习神经网络模型对所述声音进行识别。

【技术特征摘要】
1.一种声音识别方法,其特征在于,包括:实时获取声音,所述声音包括交通噪声;将所述声音转换为离散数字信号以及特征量;根据所述离散数字信号以及所述特征量实时优化深度学习神经网络模型;利用深度学习神经网络模型对所述声音进行识别。2.如权利要求1所述的方法,其特征在于,实时获取声音包括:实时采集环境声音;以及在所述环境声音满足第一条件时,实时获取所述声音。3.如权利要求1所述的方法,其特征在于,将所述声音转换为离散数字信号以及特征量包括:通过模数转换器得到离散数字信号;通过数字信号处理提取所述声音的特征向量。4.如权利要求1所述的方法,其特征在于,根据所述离散数字信号以及所述特征量实时优化深度学习神经网络模型,包括:将所述离散数字信号以及所述特征量输入深度学习神经网络模型;获取深度学习神经网络模型的输出向量,所述输出向量为所述声音与多个预定声音类型的相似度;根据所述输出向量确定所述声音的类型标签;根据所述离散数字信号、所述特征量以及所述样本标签优化深度学习神经网络模型。5.如权利要求4所述的方法,其特征在于,根据所述输出向量确定所述声音的类型标签包括:当判断所述输出向量中每一个元素的极值大于或等于阈值时,确定所...

【专利技术属性】
技术研发人员:沈松
申请(专利权)人:东方智测北京科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1