System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于深度学习的网约车上下车开关门声音识别的方法技术_技高网

基于深度学习的网约车上下车开关门声音识别的方法技术

技术编号:40062235 阅读:4 留言:0更新日期:2024-01-16 22:52
本发明专利技术公开一种基于深度学习的网约车上下车开关门声音识别的方法,具体包括下述步骤:(1)从线上数据库随机选取大量真实的历史音频数据;(2)将数据进行特征工程处理,生成训练集、测试集、验证集;(3)重复步骤(1)和步骤(2),生成多组数据;(4)利用KFold方法对数据集进行K折划分为训练集和验证集,采用卷积神经网络处理;等。本发明专利技术属于网约车技术领域,具体提供了一种基于深度学习的网约车上下车开关门声音识别的方法,该方法针对现有方案的三个问题,设计了基于深度学习的网约车上下车开关门声音识别的方法,解决了传统机器学习方法下的不易训练、迭代周期长、可拓展性差三个问题,并且大幅度提升了准确率和召回率。

【技术实现步骤摘要】

本专利技术属于网约车,具体为基于深度学习的网约车上下车开关门声音识别的方法


技术介绍

1、随着网约车的迅速发展,大量的司机涌入网约车平台,网约车平台也大力投入营销,以促进司机活跃。但是由于入驻门槛低,导致司机质量良莠不齐,继而出现司机投机取巧,企图无成本或者低成本的薅羊毛的情况,甚至有发展出一些底层灰色产业链。

2、举个例子,司机本人利用虚拟或虚假的手机号进行打车,然后再自己接单,并利用模拟gps等的一些软件进行虚假模拟,从而完单,当此虚假单逃单不支付,但是平台又需要垫付给司机钱时,司机即实现了刷钱,获得非法收入。因此,如何通过识别行车录音中是否有开关门的声音,可以作为一个重要的结论来判断此单是否有真实的乘客,所以,分析录音,做音频分类,是本专利技术的主要工作。

3、传统的音频分析,主要是利用传统的信号处理和传统的机器学习方法进行处理和分析的技术,包括时域、频域、滤波等方面的分析,具有易理解、易实现等优点。但是上述传统方法存在以下三个问题:1.不易训练,效果需要手动选择特征以及调优特征才能得到更好的效果。2.迭代周期长,因为训练的效果需要手动调优,而且如果有新增的数据,又需要进行手动调优。3.可拓展性差,传统的机器学习不适合处理大规模数据集和高维数据,不能覆盖所有的场景,无法进行批量延展。


技术实现思路

1、针对上述技术缺陷,本专利技术提供了一种基于深度学习的网约车上下车开关门声音识别的方法,该方法针对现有方案的三个问题,设计了基于深度学习的网约车上下车开关门声音识别的方法,解决了传统机器学习方法下的不易训练、迭代周期长、可拓展性差三个问题,并且大幅度提升了准确率和召回率。

2、本专利技术提供了一种基于深度学习的网约车上下车开关门声音识别的方法,具体包括下述步骤:

3、(1)从线上数据库随机选取大量真实的历史音频数据;

4、(2)将数据进行特征工程处理,生成训练集、测试集、验证集;

5、(3)重复步骤(1)和步骤(2),生成多组数据;

6、(4)利用kfold方法对数据集进行k折划分为训练集和验证集,采用卷积神经网络(convolutional neural network,cnn)进行下述操作:

7、①加载训练集和测试集,生成数据迭代器,供逐步调用迭代模型;

8、②设计简单的结构网络,这里使用两层卷积,初始化模型及相关超参数,包括隐藏层、输出层、梯度传播、附加梯度、损失函数、训练轮数及每次训练数据大小;

9、③开始训练,直到损失函数收敛,并生成cnn推理模型,其中模型可查看每个输入维度的特征重要性,依据就是在模型训练中每个维度对结果y的影响/贡献度的大小;

10、(5)读取验证集数据,并将数据输入到cnn推理模型中,验证cnn推理模型在验证集的效果;

11、(6)重复步骤(4)和步骤(5),生成最优的rnn模型,模型的评价指标主要有:准确率、精确率、召回率和f1分数。

12、(7)将实时的数据进行特征工程处理;

13、(8)把步骤(7)的实时数据输入到模型中,得出基于每个租户下,未来的每个区域内的供需预测结果,线上主要评价指标有:

14、①沿用上述步骤(6)的评价指标实时给出评价结果;

15、②因为该专利技术的方法是致力于“给网约车风控平台提供强有力的特征指标,在建设风控平台中大幅度提高准确率和减少误杀率”,线上可以通过检出率和误杀率来体现该专利技术的意义。

16、进一步地,步骤(2)中将数据进行特征工程处理,生成训练集、测试集、验证集具体包括下述步骤:

17、(1)音频数据切分,将订单中送驾行程开始和结束时间点附近进行切分,以一秒为单位,0.5秒为步长,进行切分数据,并保存为wav格式;

18、(2)运用python中的librosa进行特征处理。

19、进一步地,所述准确率是分类正确的样本数与总样本数之比,可以衡量模型整体分类的准确程度;

20、准确率=(tp+tn)/(tp+tn+fp+fn);

21、其中,tp(true positive)表示真正例,tn(true negative)表示真负例,fp(falsepositive)表示假正例,fn(false negative)表示假负例。

22、进一步地,所述精确率是指分类为正例中实际为正例的比例,可以衡量模型对正例的判断准确程度;

23、精确率=tp/(tp+fp)。

24、进一步地,所述召回率是指实际为正例中被正确分类为正例的比例,可以衡量模型对正例的覆盖程度;

25、召回率=tp/(tp+fn)。

26、进一步地,所述f1分数综合考虑了精确率和召回率,是二者的调和平均值,它能够评估模型的综合性能;

27、f1 score=2*(精确率*召回率)/(精确率+召回率)。

28、采用上述结构本专利技术取得的有益效果如下:本专利技术提出的基于深度学习的网约车上下车开关门声音识别的方法,具体具有下述优点:

29、(1)通过该方法,可以更加丰富司机的订单维度的特征,并且使得风控的特征不再流于表面,而是具有时空意义的特征,因为音频特征是通过采集分析而出来的,同时避免了音频数据的浪费,较大化的增加了数据的价值;

30、(2)因为深度学习的神经网络可以学习到更内部的演变规律,对于异常的值或者突发情况更为敏感,稳定性更高,这是传统的方法难以实现的;

31、(3)深度学习具有较强的泛化能力、可拓展性、可延展性,能够通过一个模型覆盖更多的区域。

本文档来自技高网...

【技术保护点】

1.基于深度学习的网约车上下车开关门声音识别的方法,其特征在于,具体包括下述步骤:

2.根据权利要求1所述的基于深度学习的网约车上下车开关门声音识别的方法,其特征在于,步骤(2)中将数据进行特征工程处理,生成训练集、测试集、验证集具体包括下述步骤:

3.根据权利要求1所述的基于深度学习的网约车上下车开关门声音识别的方法,其特征在于,所述准确率是分类正确的样本数与总样本数之比,可以衡量模型整体分类的准确程度;

4.根据权利要求1所述的基于深度学习的网约车上下车开关门声音识别的方法,其特征在于,所述精确率是指分类为正例中实际为正例的比例,可以衡量模型对正例的判断准确程度;

5.根据权利要求1所述的基于深度学习的网约车上下车开关门声音识别的方法,其特征在于,所述召回率是指实际为正例中被正确分类为正例的比例,可以衡量模型对正例的覆盖程度;

6.根据权利要求1所述的基于深度学习的网约车上下车开关门声音识别的方法,其特征在于,所述F1分数综合考虑了精确率和召回率,是二者的调和平均值,它能够评估模型的综合性能;

【技术特征摘要】

1.基于深度学习的网约车上下车开关门声音识别的方法,其特征在于,具体包括下述步骤:

2.根据权利要求1所述的基于深度学习的网约车上下车开关门声音识别的方法,其特征在于,步骤(2)中将数据进行特征工程处理,生成训练集、测试集、验证集具体包括下述步骤:

3.根据权利要求1所述的基于深度学习的网约车上下车开关门声音识别的方法,其特征在于,所述准确率是分类正确的样本数与总样本数之比,可以衡量模型整体分类的准确程度;

4.根据权利要求1所述的基于深度学习的...

【专利技术属性】
技术研发人员:于志杰
申请(专利权)人:北京白龙马云行科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1