声音识别方法、装置、存储介质、电子设备及车辆制造方法及图纸

技术编号:33290036 阅读:20 留言:0更新日期:2022-05-01 00:06
本公开涉及一种声音识别方法、装置、存储介质、电子设备及车辆。该方法包括:通过声音检测装置采集环境声音;根据目标声音分类模型对该环境声音进行分类处理,得到该环境声音对应的目标类别;通过展示装置展示所述目标类别。这样,可以通过对环境声音进行声音识别从而实现对周边环境物体的全面准确的识别和分类,提高了物体检测的可靠性。高了物体检测的可靠性。高了物体检测的可靠性。

【技术实现步骤摘要】
声音识别方法、装置、存储介质、电子设备及车辆


[0001]本公开涉及人工智能
,具体地,涉及一种声音识别方法、装置、存储介质、电子设备及车辆。

技术介绍

[0002]随着人工智能技术在车辆
的应用,车辆的自动驾驶或辅助驾驶技术得到了广泛发展。在相关技术中,主要以雷达或摄像头获取周边物体的信息,并通过图像处理实现自动驾驶或辅助驾驶。而雷达或摄像头都会存在检测盲区,在某些特定场景下存在环境检测可靠性较低的问题。

技术实现思路

[0003]为克服相关技术中存在的上述问题,本公开提供一种声音识别方法、装置、存储介质、电子设备及车辆。
[0004]根据本公开实施例的第一方面,提供一种声音识别方法,所述方法包括:
[0005]通过声音检测装置采集环境声音;
[0006]根据目标声音分类模型对所述环境声音进行分类处理,得到所述环境声音对应的目标类别;
[0007]通过展示装置展示所述目标类别。
[0008]可选地,所述通过展示装置展示所述目标类别包括:
[0009]确定所述目标类别对应的目标图像;
[0010]通过所述展示装置展示所述目标图像。
[0011]可选地,所述确定所述目标类别对应的目标图像包括:
[0012]根据类别图像对应关系,确定所述目标类别对应的目标图像,所述类别图像对应关系包括所述目标类别与所述目标图像的对应关系。
[0013]可选地,所述通过所述展示装置展示所述目标图像包括:
[0014]在所述展示装置的预设区域展示所述目标图像。
[0015]可选地,所述展示装置包括车辆的外反光镜、内反光镜和中控屏幕中的一种或多种。
[0016]可选地,在所述展示装置包括车辆的外反光镜的情况下,所述通过所述展示装置展示所述目标图像包括:
[0017]在检测到副驾驶座位有乘客乘坐的情况下,通过车辆两侧的外反光镜展示所述目标图像;或者,
[0018]在未检测到副驾驶座位有乘客乘坐的情况下,通过车辆驾驶员侧的外反光镜展示所述目标图像。
[0019]可选地,所述声音检测装置为一个或多个,所述声音检测装置设置在车辆的任意一侧或多侧的外反光镜内,所述环境声音为所述车辆周边的环境声音。
[0020]可选地,在所述声音检测装置为多个的情况下,所述多个声音检测装置分别设置在车辆的左侧外反光镜内和右侧外反光镜内。
[0021]可选地,所述根据目标声音分类模型对所述环境声音进行分类处理,得到所述环境声音对应的目标类别包括:
[0022]将所述环境声音输入所述目标声音分类模型,得到一个或多个第一候选类别,以及所述环境声音与每个第一候选类别的第一目标相似度;
[0023]根据所述第一目标相似度从所述第一候选类别中确定所述目标类别。
[0024]可选地,所述根据所述第一目标相似度从所述第一候选类别中确定所述目标类别包括:
[0025]将所述第一目标相似度从大到小排名前N位,且所述第一目标相似度大于或等于预设相似度阈值的第一候选类别,作为第二候选类别;
[0026]根据所述第二候选类别确定所述目标类别。
[0027]可选地,所述第二候选类别为多个,所述根据所述第二候选类别确定所述目标类别包括:
[0028]根据预设类别对应关系,确定每个第二候选类别与其他第二候选类别之间的类别关系;所述预设类别对应关系包括任意两个第二候选类别之间的类别关系,所述类别关系包括混淆关系和同类关系;
[0029]根据所述第二候选类别和类别关系,确定所述目标类别。
[0030]可选地,所述目标声音分类模型为根据目标神经网络模型训练后得到的,所述目标神经网络模型是对预设神经网络模型进行训练,并对训练后的预设神经网络模型进行模型压缩得到的模型。
[0031]可选地,所述目标声音分类模型是通过以下方式训练得到的:
[0032]获取用于训练的多个样本声音和每个所述样本声音对应的样本类别;
[0033]根据所述样本声音和所述样本类别对预设神经网络模型执行预设训练步骤,得到第一待定模型;
[0034]对所述第一待定模型进行模型压缩,得到目标神经网络模型;
[0035]根据所述样本声音和所述样本类别对所述目标神经网络模型执行所述预设训练步骤,得到第二待定模型;
[0036]根据所述第二待定模型,确定所述目标声音分类模型。
[0037]可选地,所述对所述第一待定模型进行模型压缩,得到目标神经网络模型包括:
[0038]根据所述第一待定模型的预设数目个卷积层,获取所述目标神经网络模型;其中,所述预设数目小于所述第一待定模型的卷积层总层数。
[0039]可选地,所述预设训练步骤包括:
[0040]循环执行模型训练步骤对目标模型进行训练,直至根据所述样本类别和预测类别确定训练后的目标模型满足预设停止迭代条件,所述目标模型包括预设神经网络模型或者所述目标神经网络模型,所述预测类别为所述样本声音输入该训练后的目标模型后输出的类别;
[0041]所述模型训练步骤包括:
[0042]获取所述样本声音与多个所述样本类别的第一样本相似度;
[0043]根据所述第一样本相似度,从多个所述样本类别中确定所述样本声音对应的预测类别;
[0044]在根据所述样本类别和所述预测类别确定训练后的目标模型不满足预设停止迭代条件的情况下,根据所述样本类别和所述预测类别确定目标损失值,根据所述目标损失值更新所述目标模型的参数,得到训练后的目标模型,并将该训练后的目标模型作为新的目标模型。
[0045]可选地,所述获取所述样本声音与多个所述样本类别的第一样本相似度包括:
[0046]将所述样本声音按照预设周期进行特征提取,得到多个周期的样本特征;
[0047]根据多个周期的样本特征,获取所述样本声音与多个所述样本类别的第一样本相似度。
[0048]可选地,所述根据多个周期的样本特征,获取所述样本声音与多个所述样本类别的第一样本相似度包括:
[0049]针对每个周期的样本特征,获取该样本特征对应的第一特征编码;并根据所述第一特征编码,得到该样本特征与多个样本类别的第二样本相似度;
[0050]根据多个样本特征的所述第二样本相似度,计算得到所述样本声音与多个所述样本类别的第一样本相似度。
[0051]可选地,所述样本类别包括所述目标类别和非目标类别。
[0052]可选地,所述根据所述第二待定模型,确定所述目标声音分类模型包括:
[0053]对所述第二待定模型的模型参数进行模型量化处理,得到所述目标声音分类模型。
[0054]根据本公开实施例的第二方面,提供一种声音识别装置,所述装置包括:
[0055]声音采集模块,被配置为通过声音检测装置采集环境声音;
[0056]声音分类模块,被配置为根据目标声音分类模型对所述环境声音进行分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声音识别方法,其特征在于,所述方法包括:通过声音检测装置采集环境声音;根据目标声音分类模型对所述环境声音进行分类处理,得到所述环境声音对应的目标类别;通过展示装置展示所述目标类别。2.根据权利要求1所述的方法,其特征在于,所述通过展示装置展示所述目标类别包括:确定所述目标类别对应的目标图像;通过所述展示装置展示所述目标图像。3.根据权利要求2所述的方法,其特征在于,所述确定所述目标类别对应的目标图像包括:根据类别图像对应关系,确定所述目标类别对应的目标图像,所述类别图像对应关系包括所述目标类别与所述目标图像的对应关系。4.根据权利要求2所述的方法,其特征在于,所述通过所述展示装置展示所述目标图像包括:在所述展示装置的预设区域展示所述目标图像。5.根据权利要求2所述的方法,其特征在于,所述展示装置包括车辆的外反光镜、内反光镜和中控屏幕中的一种或多种。6.根据权利要求5所述的方法,其特征在于,在所述展示装置包括车辆的外反光镜的情况下,所述通过所述展示装置展示所述目标图像包括:在检测到副驾驶座位有乘客乘坐的情况下,通过车辆两侧的外反光镜展示所述目标图像;或者,在未检测到副驾驶座位有乘客乘坐的情况下,通过车辆驾驶员侧的外反光镜展示所述目标图像。7.根据权利要求1所述的方法,其特征在于,所述声音检测装置为一个或多个,所述声音检测装置设置在车辆的任意一侧或多侧的外反光镜内,所述环境声音为所述车辆周边的环境声音。8.根据权利要求7所述的方法,其特征在于,在所述声音检测装置为多个的情况下,所述多个声音检测装置分别设置在车辆的左侧外反光镜内和右侧外反光镜内。9.根据权利要求1所述的方法,其特征在于,所述根据目标声音分类模型对所述环境声音进行分类处理,得到所述环境声音对应的目标类别包括:将所述环境声音输入所述目标声音分类模型,得到一个或多个第一候选类别,以及所述环境声音与每个第一候选类别的第一目标相似度;根据所述第一目标相似度从所述第一候选类别中确定所述目标类别。10.根据权利要求9所述的方法,其特征在于,所述根据所述第一目标相似度从所述第一候选类别中确定所述目标类别包括:将所述第一目标相似度从大到小排名前N位,且所述第一目标相似度大于或等于预设相似度阈值的第一候选类别,作为第二候选类别;根据所述第二候选类别确定所述目标类别。
11.根据权利要求10所述的方法,其特征在于,所述第二候选类别为多个,所述根据所述第二候选类别确定所述目标类别包括:根据预设类别对应关系,确定每个第二候选类别与其他第二候选类别之间的类别关系;所述预设类别对应关系包括任意两个第二候选类别之间的类别关系,所述类别关系包括混淆关系和同类关系;根据所述第二候选类别和类别关系,确定所述目标类别。12.根据权利要求1至11中任一项所述的方法,其特征在于,所述目标声音分类模型为根据目标神经网络模型训练后得到的,所述目标神经网络模型是对预设神经网络模型进行训练,并对训练后的预设神经网络模型进行模型压缩得到的模型。13.根据权利要求12所述的方法,其特征在于,所述目标声音分类模型是通过以下方式训练得到的:获取用于训练的多个样本声音和每个所述样本声音对应的样本类别;根据所...

【专利技术属性】
技术研发人员:闫志勇丁翰林王永庆张俊博王育军
申请(专利权)人:小米汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1