基于大数据的用户画像建立方法和用户画像管理系统技术方案

技术编号:37794955 阅读:11 留言:0更新日期:2023-06-09 09:25
本发明专利技术涉及信息分类处理技术领域,尤其涉及一种基于大数据的用户画像建立方法和用户画像管理系统,包括分析存在购买行为的用户的行为数据生成对应的行为标签以对用户进行画像,根据共有行为标签以计算标准参考值R并对未存在购买行为的用户进行分类,中控模块根据课程数据形成模型用户,并计算任一购买相同类型课程的用户与模型用户的相似度及相似度的平均值,中控模块根据一级用户的行为数据中的课程数据判定购买意向课程,并根据存在购买意向课程的用户与其对应的模型用户的相似度锁定目标用户。本发明专利技术能够提高用户画像的精准度,快速锁定目标用户。快速锁定目标用户。快速锁定目标用户。

【技术实现步骤摘要】
基于大数据的用户画像建立方法和用户画像管理系统


[0001]本专利技术涉及信息分类处理
,尤其涉及一种基于大数据的用户画像建立方法和用户画像管理系统。

技术介绍

[0002]用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。我们在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待的数据转化联结起来。作为实际用户的虚拟代表,用户画像所形成的用户角色并不是脱离产品和市场之外所构建出来的,形成的用户角色需要有代表性,能代表产品的主要受众和目标群体。
[0003]中国专利公开号:CN108647729B公开了一种用户画像获取方法,其公开的技术方案中能够通过对用户的基础数据及与基础数据对应的用户行为日志分别进行分类和分析,能做较好地建立用户分类模型和用户行为模型,并通过这两个模型获取不同用户的用户画像。
[0004]然而,现有技术中,未针对具有购买行为的用户的行为数据进行分析,从而无法精准的锁定目标用户,导致对用户管理的针对性不强。

技术实现思路

[0005]为此,本专利技术提供一种基于大数据的用户画像建立方法和用户画像管理系统,用以克服现有技术中未针对具有购买行为的用户的行为数据进行分析,从而无法精准的锁定目标用户,导致对用户管理的针对性不强的问题。
[0006]为实现上述目的,一方面,本专利技术提供一种基于大数据的用户画像建立方法,包括:
[0007]步骤S1,数据获取模块获取存在购买行为的用户的行为数据,中控模块提取任一所述行为数据的特征词,根据所述特征词对所述行为数据进行归类并生成对应的行为标签以对用户进行画像;
[0008]步骤S2,所述中控模块根据所述行为标签对应的所述行为数据的数量对行为标签进行等级划分,并提取存在购买行为的用户的共有行为标签以计算标准参考值R,中控模块根据任一未存在购买行为的用户的行为数据计算对应的参考值R',并根据R'与R的比值对未存在购买行为的用户进行分类;
[0009]步骤S3,所述数据获取模块提取购买相同类型课程的用户的行为数据中的课程数据,所述中控模块根据课程数据形成模型用户,并计算任一购买相同类型课程的用户与模型用户的相似度及相似度的平均值;
[0010]步骤S4,所述中控模块根据一级用户的行为数据中的课程数据判定购买意向课程,并根据存在购买意向课程的用户与其对应的模型用户的相似度锁定目标用户。
[0011]进一步地,在所述步骤S1中,当所述中控模块根据所述特征词对所述行为数据进
行归类时,所述词语库模块建立所述特征词的语料库,将特征词转化为特征词向量,计算所述特征词向量的余弦值A,在所述词语库模块中设有若干标准特征词并将标准特征词转化为标准特征词向量,计算标准特征词向量的余弦值A0;
[0012]所述中控模块计算任一所述特征词向量的余弦值A和任一所述标准特征词向量的余弦值A0的比值B,设定B=A/A0,所述中控模块将B分别与第一预设余弦值比值参量B1和第二预设余弦值比值参量B2进行比对,其中B1<1<B2,
[0013]当B1≤B≤B2时,所述中控模块将A对应的特征词归类到A0对应的标准特征词,并将A0对应的标准特征词生成行为标签;
[0014]当B<B1或B>B2时,所述中控模块继续计算A与任一所述标准特征词向量的余弦值A0的比值直至遍历各标准特征词向量。
[0015]进一步地,在所述步骤S2中,所述中控模块在完成对所述行为数据的归类后,统计所述行为标签对应的所述行为数据的数量S,中控模块根据S对行为标签进行等级划分,其中,
[0016]当S≥S4时,所述中控模块将S对应的所述行为标签划分为第一等级标签并将第一等级标签的权重设置为e1;
[0017]当S3≤S<S4时,所述中控模块将S对应的所述行为标签划分为第二等级标签并将第二等级标签的权重设置为e2;
[0018]当S2≤S<S3时,所述中控模块将S对应的所述行为标签划分为第三等级标签并将第三等级标签的权重设置为e3;
[0019]当S1≤S<S2时,所述中控模块将S对应的所述行为标签划分为第四等级标签并将第四等级标签的权重设置为e4;
[0020]当S<S1时,所述中控模块将S对应的所述行为标签划分为第五等级标签并将第五等级标签的权重设置为e5;
[0021]其中,S1为第一预设数据量,S2为第二预设数据量,S3为第三预设数据量,S4为第四预设数据量,e1为第一预设权重,e2为第二预设权重,e3为第三预设权重,e4为第四预设权重,e5为第五预设权重,S1<S2<S3<S4,e5<e4<e3<e2<e1。
[0022]进一步地,在所述步骤S2中,所述中控模块提取存在购买行为的用户的行为标签中的共有行为标签并记为标准共有行为标签,将所述标准共有行为标签中的所述第一等级标签的贡献值设置为C1,将标准共有行为标签中的所述第二等级标签的贡献值设置为C2,将标准共有行为标签中的所述第三等级标签的贡献值设置为C3,将标准共有行为标签中的所述第四等级标签的贡献值设置为C4,将标准共有行为标签中的所述第五等级标签的贡献值设置为C5,其中C5<C4<C3<C2<C1,所述中控模块根据以下公式计算标准参考值R,设定
[0023]R=∑C1
×
e1
×
x+∑C2
×
e2
×
y+∑C3
×
e3
×
k+∑C4
×
e4
×
j+∑C5
×
e5
×
z
[0024]其中,x为共有行为标签中的所述第一等级标签的数量,y为共有行为标签中的所述第二等级标签的数量,k为共有行为标签中的所述第三等级标签的数量,j为共有行为标签中的所述第四等级标签的数量,z为共有行为标签中的所述第五等级标签的数量。
[0025]进一步地,在所述步骤S2中,当所述中控模块对未存在购买行为的用户进行分类时,所述数据获取模块获取未存在购买行为的用户的行为数据并对用户进行画像,对于任
一未存在购买行为的用户,所述中控模块提取该用户的行为标签并提取该用户的行为标签中存在的标准共有行为标签,并计算其对应的参考值R

,计算R

与标准参考值R的比值D,设定D=R

/R,中控模块根据比值D对未存在购买行为的用户进行分类,其中,
[0026]当D≥D2时,所述中控模块将对应的用户分为一级用户;
[0027]当D1≤D<D2时,所述中控模块将对应的用户分为二级用户;
[0028]当D<D1时,所述中控模块将对应的用户分为三级用户;
[0029]其中,D1为第一预设参考值比值参量,D2为第二预设参考值比值参量,D1<D2。
[0030]进一步地,在所述步骤S3中,所述数据获取模块在购买相本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的用户画像建立方法,其特征在于,包括:步骤S1,数据获取模块获取存在购买行为的用户的行为数据,中控模块提取任一所述行为数据的特征词,根据所述特征词对所述行为数据进行归类并生成对应的行为标签以对用户进行画像;步骤S2,所述中控模块根据所述行为标签对应的所述行为数据的数量对行为标签进行等级划分,并提取存在购买行为的用户的共有行为标签以计算标准参考值R,中控模块根据任一未存在购买行为的用户的行为数据计算对应的参考值R',并根据R'与R的比值对未存在购买行为的用户进行分类;步骤S3,所述数据获取模块提取购买相同类型课程的用户的行为数据中的课程数据,所述中控模块根据课程数据形成模型用户,并计算任一购买相同类型课程的用户与模型用户的相似度及相似度的平均值;步骤S4,所述中控模块根据一级用户的行为数据中的课程数据判定购买意向课程,并根据存在购买意向课程的用户与其对应的模型用户的相似度锁定目标用户。2.根据权利要求1所述的基于大数据的用户画像建立方法,其特征在于,在所述步骤S1中,当所述中控模块根据所述特征词对所述行为数据进行归类时,所述词语库模块建立所述特征词的语料库,将特征词转化为特征词向量,计算所述特征词向量的余弦值A,在所述词语库模块中设有若干标准特征词并将标准特征词转化为标准特征词向量,计算标准特征词向量的余弦值A0;所述中控模块计算任一所述特征词向量的余弦值A和任一所述标准特征词向量的余弦值A0的比值B,设定B=A/A0,所述中控模块将B分别与第一预设余弦值比值参量B1和第二预设余弦值比值参量B2进行比对,其中B1<1<B2,当B1≤B≤B2时,所述中控模块将A对应的特征词归类到A0对应的标准特征词,并将A0对应的标准特征词生成行为标签;当B<B1或B>B2时,所述中控模块继续计算A与任一所述标准特征词向量的余弦值A0的比值直至遍历各标准特征词向量。3.根据权利要求2所述的基于大数据的用户画像建立方法,其特征在于,在所述步骤S2中,所述中控模块在完成对所述行为数据的归类后,统计所述行为标签对应的所述行为数据的数量S,中控模块根据S对行为标签进行等级划分,其中,当S≥S4时,所述中控模块将S对应的所述行为标签划分为第一等级标签并将第一等级标签的权重设置为e1;当S3≤S<S4时,所述中控模块将S对应的所述行为标签划分为第二等级标签并将第二等级标签的权重设置为e2;当S2≤S<S3时,所述中控模块将S对应的所述行为标签划分为第三等级标签并将第三等级标签的权重设置为e3;当S1≤S<S2时,所述中控模块将S对应的所述行为标签划分为第四等级标签并将第四等级标签的权重设置为e4;当S<S1时,所述中控模块将S对应的所述行为标签划分为第五等级标签并将第五等级标签的权重设置为e5;其中,S1为第一预设数据量,S2为第二预设数据量,S3为第三预设数据量,S4为第四预
设数据量,e1为第一预设权重,e2为第二预设权重,e3为第三预设权重,e4为第四预设权重,e5为第五预设权重,S1<S2<S3<S4,e5<e4<e3<e2<e1。4.根据权利要求3所述的基于大数据的用户画像建立方法,其特征在于,在所述步骤S2中,所述中控模块提取存在购买行为的用户的行为标签中的共有行为标签并记为标准共有行为标签,将所述标准共有行为标签中的所述第一等级标签的贡献值设置为C1,将标准共有行为标签中的所述第二等级标签的贡献值设置为C2,将标准共有行为标签中的所述第三等级标签的贡献值设置为C3,将标准共有行为标签中的所述第四等级标签的贡献值设置为C4,将标准共有行为标签中的所述第五等级标签的贡献值设置为C5,其中C5<C4<C3<C2<C1,所述中控模块根据以下公式计算标准参考值R,设定R=∑C1
×
e1
×
x+∑C2
×
e2
×
y+ΣC3
×
e3
×
k+ΣC4
×
e4
×
j+∑C5
×
e5
×
z...

【专利技术属性】
技术研发人员:关颖贤傅元弟
申请(专利权)人:读书郎教育科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1