购车能力的预测方法和预测装置制造方法及图纸

技术编号:17111626 阅读:27 留言:0更新日期:2018-01-24 22:54
本发明专利技术提供了一种购车能力的预测方法和预测装置,该预测方法包括:基于用户购车信息数据和用户购车行为数据来构造原始训练特征数据;通过预设的过滤规则对所述原始训练特征数据进行过滤处理,以获取训练特征数据;根据所述训练特征数据构建预测模型;根据所述预测模型对待预测的用户的购车特征数据进行预测。本发明专利技术的技术方案通过预测模型实现对反映购车能力的购车特征数据的自动化分级;实现了用户购车能力的自动化预测,大大降低了预测过程所花费的人力和时间成本;同时提高对反映购车能力的购车特征数据的预测准确率。

Prediction method and prediction device for car purchasing capacity

The present invention provides a method of prediction and a device for Car Buying ability, including the prediction method: user information and user behavior data Car Buying Car Buying data is constructed on the basis of the original training data; by default filtering rules of the original training data features filter processing, to obtain the features of training according to the training data; the characteristics of data to construct prediction model; forecast according to the characteristics of the Car Buying data prediction model forecast users treat. The technical scheme of the invention realizes the automation of data classification Car Buying characteristics reflect Car Buying ability through forecasting model; automated user Car Buying prediction ability, greatly reduces the cost of manpower and time spent in the prediction process; at the same time improve the prediction ability of Car Buying feature data reflect the accuracy of Car Buying.

【技术实现步骤摘要】
购车能力的预测方法和预测装置
本专利技术涉及数据挖掘领域,具体而言,本专利技术涉及一种购车能力的预测方法和预测装置。
技术介绍
近来,我国汽车销量正在缓慢增长,面对我国车市整体增速缓慢的局面,我国的汽车销售行业竞争也愈演愈烈,在如此激烈的市场竞争环境中,如何精确制定汽车营销方案成为了提高行业竞争力的关键。目前,我国购车网站的浏览日志数量非常庞大,在这些浏览日志中记录了用户对购车网站的访问行为数据,为了实现精细化的运营,需根据浏览日志准确挖掘潜在的购车用户,而潜在的购车用户是通过预测其购车能力来确定的。现有的对用户购车能力的预测主要依据预定的预测规则人工完成,但对于海量的购车网站浏览日志,人工预测具有较大的主观随意性,会造成预测结果类别过于集中,且预测结果的准确性不高的问题。
技术实现思路
为克服上述技术问题或者至少部分地解决上述技术问题,特提出以下技术方案:本专利技术的实施例提出了一种购车能力的预测预测方法,包括:基于用户购车信息数据和用户购车行为数据来构造原始训练特征数据;通过预设的过滤规则对原始训练特征数据进行过滤处理,以获取训练特征数据;根据训练特征数据构建预测模型;根据预测模型对待预测的用户的购车特征数据进行预测。优选地,基于用户购车信息数据和用户购车行为数据来构造原始训练特征数据,包括:对用户购车信息数据和用户购车行为数据进行整合处理,以生成基础变量;针对每一用户,基于预定的特征构造维度对相应的基础变量进行数据处理,以生成构造变量;基于获取到的构造变量构造针对每一用户的原始训练特征数据。更优选地,其中,预定的特征构造维度包括:预定时长内的总页面访问次数和预定时长内的在不同价格区间的页面访问次数和/或预定时长内的在不同价格区间的点击次数。优选地,预设的过滤规则包括以下至少一项:对用户的cookie信息不符合预定标识格式的原始训练特征数据进行过滤;对用户的点击次数属于预定异常值的原始训练特征数据进行过滤;对用户的页面访问次数小于预定次数阈值的原始训练特征数据进行过滤。优选地,预测方法还包括:根据购车交易业务类型,将用户的购车能力基于用户购车信息数据进行分级;其中,根据训练特征数据构建预测模型,包括:基于对用户的购车能力的分级结果,确定获取到的训练特征数据相应的级别;根据训练特征数据,并结合与训练特征数据相应的级别,来构建预测模型。优选地,预测方法还包括:根据原始训练特征数据进行原始特征的提取,并确定每一特征分类下的原始特征数据的特征分类相关度;根据特征分类相关度对原始特征数据进行选择,以获取训练特征数据。更优选地,选取特征分类相关度大于预定的相关度阈值的每一特征分类下的原始特征数据作为训练特征数据。优选地,预测方法还包括:对获取到的训练特征数据进行去重以及数据平衡化处理。优选地,根据训练特征数据构建预测模型,包括:根据训练特征数据,依据多元逻辑回归模型来构建预测模型。本专利技术的另一实施例提出了一种购车能力的预测装置,包括:数据构造模块,用于基于用户购车信息数据和用户购车行为数据来构造原始训练特征数据;数据过滤模块,用于通过预设的过滤规则对原始训练特征数据进行过滤处理,以获取训练特征数据;构建模块,用于根据训练特征数据构建预测模型;预测模块,用于根据预测模型对待预测预测的用户的购车能力进行预测。优选地,数据构造模块包括:基础变量生成单元,用于对用户购车信息数据和用户购车行为数据进行整合处理,以生成基础变量;构造变量生成单元,用于针对每一用户,基于预定的特征构造维度对相应的基础变量进行数据处理,以生成构造变量;原始训练特征数据构造单元,用于基于获取到的构造变量构造针对每一用户的原始训练特征数据。更优选地,其中,预定的特征构造维度包括:预定时长内的总页面访问次数和预定时长内的在不同价格区间的页面访问次数和/或预定时长内的在不同价格区间的点击次数。优选地,预设的过滤规则包括以下至少一项:对用户的cookie信息不符合预定标识格式的原始训练特征数据进行过滤;对用户的点击次数属于预定异常值的原始训练特征数据进行过滤;对用户的页面访问次数小于预定次数阈值的原始训练特征数据进行过滤。优选地,预测装置还包括:分级模块,用于根据购车交易业务类型,将用户的购车能力基于用户购车信息数据进行分级;构建模块,用于基于对用户的购车能力的分级结果,确定获取到的训练特征数据相应的级别;根据训练特征数据,并结合与训练特征数据相应的级别,来构建预测模型。优选地,预测装置还包括:提取模块,用于根据原始训练特征数据进行原始特征的提取,并确定每一特征分类下的原始特征数据的特征分类相关度;选择模块,用于根据特征分类相关度对原始特征数据进行选择,以获取训练特征数据。更优选地,选择模块包括:获取单元,用于选取特征分类相关度大于预定的相关度阈值的每一特征分类下的原始特征数据作为训练特征数据。优选地,预测装置还包括:数据处理模块,用于对获取到的训练特征数据进行去重以及数据平衡化处理。优选地,构建模块用于根据训练特征数据,依据多元逻辑回归模型来构建预测模型。本专利技术的技术方案通过构造原始训练特征数据,并对该原始训练特征数据进行过滤处理,作为构建的预测模型的训练特征数据;通过预测模型实现对反映购车能力的购车特征数据的自动化分级;实现了用户购车能力的自动化预测,大大降低了预测过程所花费的人力和时间成本;同时提高对反映购车能力的购车特征数据的预测准确率。本专利技术附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术中一个实施例的购车能力的预测方法的流程示意图;图2为本专利技术的具体实施例中构造原始训练特征数据的流程示意图;图3为本专利技术的具体实施例中基础变量和构造变量的示意图;图4为本专利技术的具体实施例中构建预测模型的流程示意图;图5为本专利技术中另一实施例的购车线索交易转化的预测装置的结构框架示意图;图6为本专利技术的具体实施例的中数据构造模块的结构框架示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本专利技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。本
技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本专利技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语本文档来自技高网
...
购车能力的预测方法和预测装置

【技术保护点】
一种购车能力的预测方法,其特征在于,包括:基于用户购车信息数据和用户购车行为数据来构造原始训练特征数据;通过预设的过滤规则对所述原始训练特征数据进行过滤处理,以获取训练特征数据;根据所述训练特征数据构建预测模型;根据所述预测模型对待预测的用户的购车特征数据进行预测。

【技术特征摘要】
1.一种购车能力的预测方法,其特征在于,包括:基于用户购车信息数据和用户购车行为数据来构造原始训练特征数据;通过预设的过滤规则对所述原始训练特征数据进行过滤处理,以获取训练特征数据;根据所述训练特征数据构建预测模型;根据所述预测模型对待预测的用户的购车特征数据进行预测。2.根据权利要求1所述的方法,其特征在于,基于用户购车信息数据和用户购车行为数据来构造原始训练特征数据,包括:对用户购车信息数据和用户购车行为数据进行整合处理,以生成基础变量;针对每一用户,基于预定的特征构造维度对相应的基础变量进行数据处理,以生成构造变量;基于获取到的构造变量构造针对每一用户的原始训练特征数据。3.根据权利要求2所述的方法,其中,所述预定的特征构造维度包括:预定时长内的总页面访问次数和预定时长内的在不同价格区间的页面访问次数和/或预定时长内的在不同价格区间的点击次数。4.根据权利要求1-3任一项所述的方法,其特征在于,所述预设的过滤规则包括以下至少一项:对用户的cookie信息不符合预定格式的原始训练特征数据进行过滤;对用户的点击次数属于预定异常值的原始训练特征数据进行过滤;对用户的页面访问次数小于预定次数阈值的原始训练特征数据进行过滤。5.根据权利要求1所述的方法,其特征在于,还包括:根据购车交易业务类型,将用户的购车能力基于用户购车信息数据进行分级;其中,根据所述训练特征数据构建预测模型,包括:基于对用户的购车能力的分级结果,确定获取到的训练特征数据相应的级别;根据所述训练特征数据,并结合与所述训练特征数据相应的级别,来构建预测模型。6.根据权利要求1-3任一项所述的方法,其特征在于,还包括:根据所述原始训练特征数据进行原始特征的提取,并确定每一特征分类下的原始特征数据的特征分类相关度;根据所述特征分类相关度对所述原始特征数据进行选择,以获取训练特征数据。7.根据权利要求6所述的方法,其特征在于,选取特征分类相关度大于预定的相关度阈值的所述每一特征分类下的原始特征数据作为所述训练特征数据。8.根据权利要求1所述的方法,其特征在于,还包括:对获取到的所述训练特征数据进行去重以及数据平衡化处理。9.根据权利要求1所述的方法,其特征在于,根据所述训练特征数据构建预测模型,包括:根据所述训练特征数据,依据多元逻辑回归模型来构建预测模型。10.一种购车能力的预测装置,其特征在于,包括:数据构造模块,用于基于用户购车信息数据和...

【专利技术属性】
技术研发人员:贾东
申请(专利权)人:北京车慧互动广告有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1