一种基于多维度信息融合的汽车线索质量判别方法技术

技术编号:39490784 阅读:8 留言:0更新日期:2023-11-24 11:13
本申请公开了一种基于多维度信息融合的汽车线索质量判别方法,所述基于多维度信息融合的汽车线索质量判别方法包括如下步骤:

【技术实现步骤摘要】
一种基于多维度信息融合的汽车线索质量判别方法


[0001]本申请涉及汽车线索质量判别领域,尤其是一种基于多维度信息融合的汽车线索质量判别方法


技术介绍

[0002]汽车资讯媒体是各大汽车主机厂获取线索
(
留资或者转化的手机号
)
的主要渠道,在信息渠道大爆发的今天,量级对于汽车主机厂来说,不再是最主要的考核目标,而线索质量则为重中之重;

[0003]线索供应平台想要对线索质量做到精准判别和可靠把控存在如下困难
1.
主机厂对于线索供应平台提供的线索质量
(
有效率
)
反馈次数较少,且粒度较粗,导致线索供应平台可获取到的线索维度信息较少;
2.
当前线索供应平台对于线索质量
(
有效率
)
的判定主要通过分析智能
(
或人工
)
外呼的结果,这种方式会受到用户主观影响
(
或不配合,或言行不一致
)
,以这种方式得到的线索质量与主机厂商反馈线索质量不完全等价,存在一定偏差;
3.
通过智能
(
或人工外呼
)
的线索质量判别的方法存在滞后性,只能在线索入库后进行外呼,作用于后续交付,无法在线索入库前进行判别,节省线索获取成本;
4.
智能
(
或人工外呼
)
线索质量判别方法,对于最终输出的线索量质量,可解释性较差

因此,针对上述问题提出一种基于多维度信息融合的汽车线索质量判别方法


技术实现思路

[0004]在本实施例中提供了一种基于多维度信息融合的汽车线索质量判别方法用于解决现有技术中的普通线索供应平台对线索质量的精准判别和可靠把控存在困难的问题

[0005]根据本申请的一个方面,提供了一种基于多维度信息融合的汽车线索质量判别方法,所述基于多维度信息融合的汽车线索质量判别方法包括如下步骤:
[0006]1、
特征标签数据生成;
[0007]2、
有效率组成维度预估;
[0008]3、
有效率基础维度信息融合;
[0009]4、
有效标准推理;
[0010]5、
有效率标准解释

[0011]进一步地,所述步骤1中,对用户购车意图

外呼接通等各维度信息进行监督预测,监督预测时,进行特征标签数据生成,通过语音转文本技术
(ASR)
,将智能
(
或人工
)
外呼录音文件,转换成语音对话,专业标注人员通过其对于对话的理解,为这一通对话标注上对应的意图标签,然后建立线索基础属性特征和建立线索用户站内行为信息特征;所述意图标签包括:是否关注车型
/
品牌

是否有购车计划,所述线索基础属性特征包括:性别

城市和来源,所述线索用户站内行为信息特征包括:搜索

关注

车型偏好

购车意向度

[0012]进一步地,所述所述外呼接通时,对数据进行预处理,数据预处理采用数据预处理模块进行处理,所述数据预处理模块包括语音转文字单元和文字纠错单元,所述语音转文
字单元抽取智能
(
或人工
)
外呼接通录音数据,过滤录音时长小于
15s
的录音文件,然后对录音文件进行转换,获取得到每条线索对应的对话文本文件,通过文字纠错单元对对话文本文件进行处理,处理时通过声韵母模型
+
语言概率模型对对话文本错误语句进行文本纠错,得到正确的文本信息

[0013]进一步地,所述步骤2中,利用线索维度基础属性特征和线索用户站内行为信息特征建立意图预估模型,对模型进行训预估未进行智能
(
或人工
)
外呼的线索,最终得到所有入库线索对应的意图标签练评估,得到各维度最准判别模型,预估未进行智能
(
或人工
)
外呼的线索,最终得到所有入库线索对应的意图标签;所述预估模型包括标签构建单元

特征工程单元

模型训练单元和维度信息预测单元,所述标签构建单元对基于步骤1中得到的对话文本信息和未接通线索,由汽车领域专业人员对每一条线索对应的文本数据进行接通

单轮意图

整轮意向对应的标签标注,得到有效率组成维度信息对应的标签数据,所述单轮意图包括车型

品牌

购车计划

[0014]进一步地,所述特征工程单元通过执行
Hive
任务将线索基础维度
(
性别

手机号

城市

留资车型等
)
信息进行编码后与对应的线索用户的特征
(
包括但不限于用户进
N
天活跃天数


N
天搜索留资车型次数

留资车型在用户偏好车型中的排序值等
)
进行拼接,将整体线索数据按照时间维度进行切分,得到离线训练样本和离线预测样本

[0015]进一步地,所述模型训练单元对于有效率组成信息的每个维度:接通

车型

品牌

购车计划等,利用离线构造的训练样本基于集成方法
(XGBoos/LightGBM/CatBoost)
或深度学习方法
(DNN/LSTM)
分别训练训一个有监督模型;所述维度信息预测单元,基于每个维度上训练好的模型对离线预测样本进行预测,获取每条线索在各个维度上的信息预估结果:
clue1,
接通,不关注车型,关注品牌,有购车计划

[0016]进一步地,所述步骤3中,基于有效率各个基础维度的信息预估信息
(
是否关注车型

是否关注品牌

是否有购车计划

是否外呼会接通等
)
,将各个维度的信息按照“或”、“且”、“条件”等融合方式进行融合,分别计算每种融合方式下对应的线索有效率

[0017]进一步地,所述步骤4中,将每种融合方式下的有效率与主机厂反馈的有效率进行对比验证:分别计算每种融合方式下对应的相对偏差

周期稳定性等指标,综合相对偏差和周期稳定性两个指标表现,推理出最接近厂商有效判别的标准

[0018]进一步地,所述步骤4中,设置有效率标准推理模块,所述有效本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于多维度信息融合的汽车线索质量判别方法,其特征在于:所述基于多维度信息融合的汽车线索质量判别方法包括如下步骤:
1、
特征标签数据生成;
2、
有效率组成维度预估;
3、
有效率基础维度信息融合;
4、
有效标准推理;
5、
有效率标准解释
。2.
根据权利要求1所述的一种基于多维度信息融合的汽车线索质量判别方法,其特征在于:所述步骤1中,对用户购车意图

外呼接通等各维度信息进行监督预测,监督预测时,进行特征标签数据生成,通过语音转文本技术
(ASR)
,将智能
(
或人工
)
外呼录音文件,转换成语音对话,专业标注人员通过其对于对话的理解,为这一通对话标注上对应的意图标签,然后建立线索基础属性特征和建立线索用户站内行为信息特征;所述意图标签包括:是否关注车型
/
品牌

是否有购车计划,所述线索基础属性特征包括:性别

城市和来源,所述线索用户站内行为信息特征包括:搜索

关注

车型偏好

购车意向度
。3.
根据权利要求2所述的一种基于多维度信息融合的汽车线索质量判别方法,其特征在于:所述所述外呼接通时,对数据进行预处理,数据预处理采用数据预处理模块进行处理,所述数据预处理模块包括语音转文字单元和文字纠错单元,所述语音转文字单元抽取智能
(
或人工
)
外呼接通录音数据,过滤录音时长小于
15s
的录音文件,然后对录音文件进行转换,获取得到每条线索对应的对话文本文件,通过文字纠错单元对对话文本文件进行处理,处理时通过声韵母模型
+
语言概率模型对对话文本错误语句进行文本纠错,得到正确的文本信息
。4.
根据权利要求1所述的一种基于多维度信息融合的汽车线索质量判别方法,其特征在于:所述步骤2中,利用线索维度基础属性特征和线索用户站内行为信息特征建立意图预估模型,对模型进行训预估未进行智能
(
或人工
)
外呼的线索,最终得到所有入库线索对应的意图标签练评估,得到各维度最准判别模型,预估未进行智能
(
或人工
)
外呼的线索,最终得到所有入库线索对应的意图标签;所述预估模型包括标签构建单元

特征工程单元

模型训练单元和维度信息预测单元,所述标签构建单元对基于步骤1中得到的对话文本信息和未接通线索,由汽车领域专业人员对每一条线索对应的文本数据进行接通

单轮意图

整轮意向对应的标签标注,得到有效率组成维度信息对应的标签数据,所述单轮意图包括车型

品牌

购车计划
。5.
根据权利要求4所述的一种基于多维度信息融...

【专利技术属性】
技术研发人员:付东东孙傲雪郑祺张忠山
申请(专利权)人:北京比特易湃信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1