一种基于声纹和ASR技术对空跑刷单进行筛选的方法及装置制造方法及图纸

技术编号:31829053 阅读:17 留言:0更新日期:2022-01-12 13:03
本发明专利技术公开了一种基于声纹和ASR技术对空跑刷单进行筛选的方法及装置,其中方法包括:获取网约车订单对应的行程录音数据;对行程录音数据进行声纹分析,获取声纹数据;基于ASR技术对行程录音数据进行处理,获取语音文本数据;将行程录音数据、声纹数据和语音文本数据分别输入串联运行的空载场景识别模型、转向灯场景识别模型、车内人数场景识别模型和导航声音场景识别模型,获取场景识别结果;基于场景识别结果,对存在刷单风险的网约车订单生成对应的场景标签;将网约车订单对应的场景标签和网约车订单数据输入刷单识别模型中进行刷单识别,基于刷单识别的结果输出对应的刷单风险标签。本发明专利技术通过多维度识别,使得刷单识别筛选高效而准确。选高效而准确。选高效而准确。

【技术实现步骤摘要】
一种基于声纹和ASR技术对空跑刷单进行筛选的方法及装置


[0001]本专利技术涉及网约车刷单的筛选方法的
,具体涉及一种基于声纹和ASR技术对空跑刷单进行筛选的方法及装置。

技术介绍

[0002]随着互联网的发展,人们的出行方式也随之改变,其中,网约车业务由于其便捷性和及时性受到不断推广。在网约车平台推广网约车服务的过程中,为了调动司机接收网约车订单的热情,通常会采用在早晚高峰时间或者进行每日单量限制时进行相应的司机补贴,或者根据司机的订单量和绩效发放补贴,通常,司机发放的补贴根据网约车的订单情况来确定。
[0003]但是,部分网约车司机为了获取补贴,会采取各种作弊行为,其中最为常见的是利用空跑刷单来获取补贴,导致网约车异常运行。在传统的互联网约车刷单筛选排查中,司机通过作弊行为实现网约车空跑刷单的订单,需要对完成后的订单进行分析来进行刷单情况的确定,对司机的监控是很难进行的,并且,现有技术中订单分析的方法常常会出现误差,且取证方式不完善使得无法获得直接的证据,极大地影响了网约车运行状态的判断结果。
[0004]申请人经过对网约车领域的研究后发现,在现有的针对网约车司机进行刷单的风险识别的方法中,工作量较大,使得筛选识别的效率较低,且容易出现筛选误差,影响司机的体验。为此,亟需专利技术一种效率高且准确性高的用于筛选网约车司机空跑刷单的方法。

技术实现思路

[0005]为了克服上述现有的网约车刷单识别方法效率低准确性低的技术缺陷,本专利技术提供一种基于声纹和ASR技术对空跑刷单进行筛选的方法及装置。
[0006]为了解决上述问题,本专利技术按以下技术方案予以实现的:
[0007]第一方面,本专利技术公开一种基于声纹和ASR技术对空跑刷单进行筛选的方法,包括如下步骤:
[0008]获取网约车订单对应的行程录音数据;
[0009]对行程录音数据进行声纹分析,获取声纹数据;
[0010]基于ASR技术对行程录音数据进行处理,获取语音文本数据;
[0011]将行程录音数据、声纹数据和语音文本数据分别输入串联运行的空载场景识别模型、转向灯场景识别模型、车内人数场景识别模型和导航声音场景识别模型,获取场景识别结果;
[0012]基于场景识别结果,对存在刷单风险的网约车订单生成对应的场景标签;
[0013]将网约车订单对应的场景标签和网约车订单数据输入刷单识别模型中进行刷单识别,基于刷单识别的结果输出对应的刷单风险标签。
[0014]作为优选实施,所述获取场景识别结果,具体包括:
[0015]启动场景识别模型,将行程录音数据、声纹数据和语音文本数据分别输入至串联
运行的多个场景识别模型中,具体包括空载场景识别模型、转向灯场景识别模型、车内人数场景识别模型和导航声音场景识别模型,其中,空载场景识别模型中包括用于识别各种空载情况的若干个空载模型,基于行程录音和语音文本数据进行语义分析,以获取空载情况;转向灯场景识别模型中包括用于识别不同转向灯情况的若干个转向灯模型,基于转向灯提示音的声纹与声纹数据进行匹配度比对,以获取转向灯情况;车内人数场景识别模型中包括若干个乘客人数模型,对行程录音数据和声纹数据中人类声纹数量进行分析,并通过对语音文本数据的语义进行分析,以获取车内人数情况;导航声音场景识别模型包括若干个导航声音模型,基于导航声音的声纹对声纹数据进行声纹分析,并对导航声音相应的语音文本数据进行语义分析,以获取导航情况;并行处理空载情况、转向灯情况、乘客人数情况和导航情况后,输出相应的场景识别结果。
[0016]作为优选实施,所述将网约车订单对应的场景标签和网约车订单数据输入刷单识别模型中进行刷单识别,基于刷单识别的结果输出对应的刷单风险标签,具体包括:
[0017]在获取基于多个串联运行的场景识别模型的场景识别结果所生成的场景标签后,运行刷单识别模型,将场景标签中以及该网约车订单对应的声纹数据和语音文本数据输入到刷单识别模型中,刷单识别模型基于声纹数据和语音文本数据进行刷单识别,结合网约车订单数据重新对场景标签进行核实和修正,生成并输出对应的刷单风险标签,将刷单风险标签添加至对应的网约车订单。
[0018]作为优选实施,所述对行程录音数据进行声纹分析,获取声纹数据,具体包括:
[0019]预先将网约车订单对应司机的声纹注册至声纹数据库中,将行程录音数据输入声纹模型中,分析出行程录音中声纹的数量和类型,将其中的转向灯提示音声纹、导航声音声纹和人类声音声纹进行提取,通过声纹匹配将人类声音声纹中的司机声纹去除,以获取乘客声纹,将转向灯提示音声纹、导航声音声纹和乘客声纹整合成声纹数据。
[0020]作为优选实施,所述基于ASR技术对行程录音数据进行处理,获取语音文本数据,具体包括:
[0021]将行程录音数据输入至ASR模型中,ASR模型将行程录音数据转换为对应的文字,以形成语音文本数据。
[0022]第二方面,本专利技术还公开一种基于声纹和ASR技术对空跑刷单进行筛选的装置,包括录音获取模块、声纹分析模块、文本转换模块、场景识别模块、场景标签模块和刷单识别模块,具体包括:
[0023]录音获取模块用于获取网约车订单对应的行程录音数据;
[0024]声纹分析模块用于对行程录音数据进行声纹分析,获取声纹数据;
[0025]文本转换模块用于基于ASR技术对行程录音数据进行处理,获取语音文本数据;
[0026]场景识别模块用于将行程录音数据、声纹数据和语音文本数据分别输入串联运行的空载场景识别模型、转向灯场景识别模型、车内人数场景识别模型和导航声音场景识别模型,获取场景识别结果;
[0027]场景标签模块用于基于场景识别结果,对存在刷单风险的网约车订单生成对应的场景标签;
[0028]刷单识别模块用于将网约车订单对应的场景标签和网约车订单数据输入刷单识别模型中进行刷单识别,基于刷单识别的结果输出对应的刷单风险标签。
[0029]作为优选实施,所述场景识别模块运行时,具体执行:
[0030]启动场景识别模型,将行程录音数据、声纹数据和语音文本数据分别输入至串联运行的多个场景识别模型中,具体包括空载场景识别模型、转向灯场景识别模型、车内人数场景识别模型和导航声音场景识别模型,其中,空载场景识别模型中包括用于识别各种空载情况的若干个空载模型,基于行程录音和语音文本数据进行语义分析,以获取空载情况;转向灯场景识别模型中包括用于识别不同转向灯情况的若干个转向灯模型,基于转向灯提示音的声纹与声纹数据进行匹配度比对,以获取转向灯情况;车内人数场景识别模型中包括若干个乘客人数模型,对行程录音数据和声纹数据中人类声纹数量进行分析,并通过对语音文本数据的语义进行分析,以获取车内人数情况;导航声音场景识别模型包括若干个导航声音模型,基于导航声音的声纹对声纹数据进行声纹分析,并对导航声音相应的语音文本数据进行语义分析,以获取导航情况;并行处理空载情况、转向灯情况、乘客人数情况和导航情况本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于声纹和ASR技术对空跑刷单进行筛选的方法,其特征在于,包括如下步骤:获取网约车订单对应的行程录音数据;对行程录音数据进行声纹分析,获取声纹数据;基于ASR技术对行程录音数据进行处理,获取语音文本数据;将行程录音数据、声纹数据和语音文本数据分别输入串联运行的空载场景识别模型、转向灯场景识别模型、车内人数场景识别模型和导航声音场景识别模型,获取场景识别结果;基于场景识别结果,对存在刷单风险的网约车订单生成对应的场景标签;将网约车订单对应的场景标签和网约车订单数据输入刷单识别模型中进行刷单识别,基于刷单识别的结果输出对应的刷单风险标签。2.根据权利要求1所述的基于声纹和ASR技术对空跑刷单进行筛选的方法,其特征在于,所述获取场景识别结果,具体包括:启动场景识别模型,将行程录音数据、声纹数据和语音文本数据分别输入至串联运行的多个场景识别模型中,具体包括空载场景识别模型、转向灯场景识别模型、车内人数场景识别模型和导航声音场景识别模型,其中,空载场景识别模型中包括用于识别各种空载情况的若干个空载模型,基于行程录音和语音文本数据进行语义分析,以获取空载情况;转向灯场景识别模型中包括用于识别不同转向灯情况的若干个转向灯模型,基于转向灯提示音的声纹与声纹数据进行匹配度比对,以获取转向灯情况;车内人数场景识别模型中包括若干个乘客人数模型,对行程录音数据和声纹数据中人类声纹数量进行分析,并通过对语音文本数据的语义进行分析,以获取车内人数情况;导航声音场景识别模型包括若干个导航声音模型,基于导航声音的声纹对声纹数据进行声纹分析,并对导航声音相应的语音文本数据进行语义分析,以获取导航情况;并行处理空载情况、转向灯情况、乘客人数情况和导航情况后,输出相应的场景识别结果。3.根据权利要求2所述的基于声纹和ASR技术对空跑刷单进行筛选的方法,其特征在于,所述将网约车订单对应的场景标签和网约车订单数据输入刷单识别模型中进行刷单识别,基于刷单识别的结果输出对应的刷单风险标签,具体包括:在获取基于多个串联运行的场景识别模型的场景识别结果所生成的场景标签后,运行刷单识别模型,将场景标签中以及该网约车订单对应的声纹数据和语音文本数据输入到刷单识别模型中,刷单识别模型基于声纹数据和语音文本数据进行刷单识别,结合网约车订单数据重新对场景标签进行核实和修正,生成并输出对应的刷单风险标签,将刷单风险标签添加至对应的网约车订单。4.根据权利要求1所述的基于声纹和ASR技术对空跑刷单进行筛选的方法,其特征在于,所述对行程录音数据进行声纹分析,获取声纹数据,具体包括:预先将网约车订单对应司机的声纹注册至声纹数据库中,将行程录音数据输入声纹模型中,分析出行程录音中声纹的数量和类型,将其中的转向灯提示音声纹、导航声音声纹和人类声音声纹进行提取,通过声纹匹配将人类声音声纹中的司机声纹去除,以获取乘客声纹,将转向灯提示音声纹、导航声音声纹和乘客声纹整合成声纹数据。5.根据权利要求1所述的基于声纹和ASR技术对空跑刷单进行筛选的方法,其特征在于,所述基于ASR技术对行程录音数据进行处理,获取语音文本数据,具体包括:
将行程录音数据输入至ASR模型中,ASR模型将行程录音数据转换为对应的文字,以形成语音文本数据。6.一种基于声纹和AS...

【专利技术属性】
技术研发人员:王婷
申请(专利权)人:广州宸祺出行科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1