【技术实现步骤摘要】
数据处理方法、装置、存储介质及电子设备
[0001]本专利技术涉及数据处理领域,特别是涉及一种数据处理方法、装置、存储介质及电子设备。
技术介绍
[0002]随着中国民用航空的快速发展,选择民航出行的用户越来越多,因而对用户进行价值分析是十分必要的。
[0003]目前对用户进行价值分析最常用的方法是基于RFM模型进行分类处理,即按照设定的标准为每个用户的R、F和M特征进行打分,R为最近一次消费,F为消费频率,M为消费金额,分值的大小取决于偏好,用户的潜在价值越大,打的分数就越高。RFM模型在进行用户价值分类时是按每个特征各自的得分高低进行分类的,即RFM模型是按照每个特征得分的高低进行排列组合,具有8个类别,每个用户根据3个特征对应的分值的高低得到对应的类别。
[0004]但是,RFM模型在进行用户分类时仅考虑了3个特征,特征维度较少,进而会导致各类别之间的界限不清晰,且每个类别的用户不存在显著的特点,因此基于RFM模型对用户进行价值分析的准确度较低。
技术实现思路
[0005]针对上述技术问 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取目标用户的第一事件集H={h1,h2,h3,...,h
n
},h
i
=(d
i
,p
i
,t
i
),i=1,2,...,n;其中,h
i
为第i个第一事件,d
i
为第i个第一事件对应的第一事件参数,p
i
为第i个第一事件对应的第二事件参数,t
i
为第i个第一事件对应的事件完成时间,t1<t2<t3<...<t
n
≤t
now
,t
now
为当前时间;根据当前时间t
now
和基准时间t0,从H中确定第一事件子集H1={h
n
‑
a+1
,h
n
‑
a+2
,h
n
‑
a+3
,...,h
n
};其中,t0≤t
n
‑
a+1
<t
n
‑
a+2
<t
n
‑
a+3
<...<t
n
≤t
now
,a为对应的事件完成时间在t0和t
now
之间的第一事件的数量;根据当前时间t
now
和基准时间t0,获取所述目标用户的第二事件集M={m1,m2,m3,...,m
z
};其中,m
j
为第j个第二事件,j=1,2,...,z;确定所述目标用户对应的用户特征向量F=(a,D,P/a,z,t
now
‑
t1,t
now
‑
t
n
);其中,D为第三事件参数, D=∑
ni=n
‑
a+1
d
i
,P为第四事件参数,P=∑
ni=n
‑
a+1
p
i
;根据F,在若干候选类别标识中,确定出目标类别标识。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取若干候选特征信息;根据若干所述候选特征信息,获取若干参考用户对应的候选特征参数集W={w1,w2,w3,...,wv},wk=(wk1,wk2,wk3,...,wk
h
),k=1,2,...,v;其中,wk为第k个候选特征信息对应的参数组,v为候选特征信息的数量;wk
g
为第g个参考用户对应第k个候选特征信息的参数,g=1,2,...,h,h为参考用户的数量;确定W中每两个所述参数组之间的相关系数;每一所述相关系数用于表示对应的两个候选特征信息之间的相关性,每一所述相关系数均符合如下条件:;其中,1≤x≤v,1≤y≤v,x≠y,pearson
xy
为wx和wy之间的相关系数,wx
av
=(∑
hg=1
wx
g
)/h,wy
av
=(∑
hg=1
wy
g
)/h;根据若干所述相关系数对W中的若干参数组进行聚类处理,得到若干聚类组;所述聚类处理的聚类条件为相关系数大于第一阈值,每一所述聚类组包括至少一个参数组;根据预设的第一筛选规则,将每一所述聚类组中的一个参数组确定为第一参数组,得到第一参数组集;根据预设的第二筛选规则,将第一参数组集中的至少部分第一参数组确定为第二参数组,得到第二参数组集;将所述第二参数组集中每一所述第二参数组对应的候选特征信息分别作为一个目标特征信息,得到目标特征信息集;所述目标特征信息集包括第一目标特征信息、第二目标特征信息、第三目标特征信息、第四目标特征信息、第五目标特征信息和第六目标特征信息;所述确定所述目标用户对应的用户特征向量F=(a,D,P/a,z,t
now
‑
t1,t
now
‑
t
n
),包括:根据H、H1、M和目标特征信息集,确定所述目标用户对应的用户特征向量F=(a,D,P/a,z,t
now
‑
t1,t
now
‑
t
n
);
其中,a为第一目标特征信息对应的参数,D为第二目标特征信息对应的参数,P/a为第三目标特征信息对应的参数,z为第四目标特征信息对应的参数,t
now
‑
t1为第五目标特征信息对应的参数,t
now
‑
t
n
为第六目标特征信息对应的参数。3.根据权利要求2所述的方法,其特征在于,所述根据预设的第一筛选规则,将每一所述聚类组中的一个参数组确定为第一参数组,得到第一参数组集,包括:根据预设的配置文件,将每一所述聚类组中对应的影响系数最大的参数组均作为第一参数组;根据每一所述第一参数组,...
【专利技术属性】
技术研发人员:王殿胜,薄满辉,唐红武,张帅,张凯伦,陈晓宇,
申请(专利权)人:中航信移动科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。