一种基于模糊算法的用户数据采集方法及系统技术方案

技术编号:38349379 阅读:8 留言:0更新日期:2023-08-02 09:29
本发明专利技术公开了一种基于模糊算法的用户数据采集方法及系统,所述采集方法包括以下步骤:从模糊规则中获取产品的参数后,通过公式建立属性系数,将产品通过属性系数由大到小进行排序生成优先级排序表,通过数据类型和业务需求使用模糊逻辑和模糊推理来建立模糊规则,从模糊规则中获取产品的参数后,通过公式建立属性系数,将产品通过属性系数由大到小进行排序,生成优先级排序表,从而提高对重要性大的用户特征数据的关注度。本发明专利技术将属性系数小于筛选阈值的产品从排序表中删除,降低企业计算量,从而降低计算成本,提高计算效率,且降低数据存储量。据存储量。据存储量。

【技术实现步骤摘要】
一种基于模糊算法的用户数据采集方法及系统


[0001]本专利技术涉及数据采集
,具体涉及一种基于模糊算法的用户数据采集方法及系统。

技术介绍

[0002]用户数据采集系统是一种用于收集、存储和分析用户数据的系统,用户数据采集系统的主要目的是收集和分析用户数据,以便企业或组织能够更好地了解用户的行为、偏好和需求,从而提高产品和服务的质量和用户体验。此外,用户数据采集系统还可以帮助企业或组织制定更精准的营销策略、提高用户留存率和转化率,从而增加收入和利润。
[0003]现有技术存在以下不足:现有用户数据采集系统在采集用户数据后,仅通过模糊算法来获取到产品,然而,由于产品的数据量庞大,用户数据采集系统对产品没有重要度排序,以及筛选,大量的产品数据一是增加系统的计算负担,增加计算成本,降低计算效率,二是增加系统的存储负担,使用局限性大。

技术实现思路

[0004]本专利技术的目的是提供一种基于模糊算法的用户数据采集方法及系统,以解决
技术介绍
中不足。
[0005]为了实现上述目的,本专利技术提供如下技术方案:一种基于模糊算法的用户数据采集方法,所述采集方法包括以下步骤:
[0006]S1:确定需要采集的用户数据类型,并根据数据类型和业务需求使用模糊逻辑和模糊推理来建立模糊规则;
[0007]S2:从模糊规则中获取产品的参数后,通过公式建立属性系数,将产品通过属性系数由大到小进行排序生成优先级排序表;
[0008]S3:设定筛选阈值,将属性系数小于筛选阈值的产品从排序表中删除;
[0009]S4:使用模糊聚类算法为产品分入多个用户,并通过可视化工具对分组结果分析和可视化;
[0010]S5:将用户数据存储在数据库中。
[0011]在一个优选的实施方式中,步骤S2中,建立所述属性系数包括以下步骤:
[0012]获取产品中的特征参数以及效益参数,将特征参数与效益参数通过公式计算后建立属性系数,表达式为:
[0013][0014]式中,为特征参数,为效益参数,α、β分别为特征参数以及效益参数的比例系数,且α>β>0。
[0015]在一个优选的实施方式中,所述特征参数用于体现产品的用户感兴趣度,其中,Y
i
表示用户浏览产品数量,S
j
表示用户浏览产品时间,D
j
表示产品点击率。
[0016]在一个优选的实施方式中,所述效益参数效益参数用于体现产品的经济效益,其中,(XS
z
+PF
z
)表示产品的数据项权重系数,XS
z
表示销售量的权重系数,PF
z
表示用户评价分数的权重系数,(XS
g
+PF
g
)表示产品的数据项归一化值,XS
g
表示销售量的归一化值,PF
g
表示用户评价分数的归一化值。
[0017]在一个优选的实施方式中,所述销售量的归一化值XS
g
的计算公式为:
[0018][0019]式中,XS
i
为最近一段时间产品的销售量,XS
max
为产品的最大销售量,XS
min
为产品的最小销售量;
[0020]所述用户评价分数的归一化值PF
z
的计算公式为:
[0021][0022]式中,PF
i
为最近一段时间产品的用户评价分数,XS
max
为产品的最大用户评价分数,XS
min
为产品的最小用户评价分数。
[0023]在一个优选的实施方式中,获取所述产品的属性系数SX
i
后,将产品依据属性系数SX
i
由大到小进行排序,生成优先级排序表,优先级排序表为其中,其中,
[0024]在一个优选的实施方式中,获取所述产品的属性系数SX
i
后,设定筛选阈值S
xz
,将产品的属性系数SX
i
与筛选阈值S
xz
进行对比,若属性系数SX
i
<筛选阈值S
xz
,系统判定该产品的关注度未达到要求,将产品从优先级排序表中去除,若属性系数SX
i
≥筛选阈值S
xz
,系统判定该产品的关注度达到要求,产品进入优先级排序表中排序。
[0025]在一个优选的实施方式中,步骤S1还包括以下步骤:
[0026]S1.1:根据数据类型和业务需求,建立的模糊变量和模糊集,设计模糊规则库,将用户输入的数据转换为模糊值;
[0027]S1.2:使用模糊推理方法对用户数据进行推理,将推理结果转化为数值或分类;
[0028]S1.3:通过历史数据验证模型,并对模型进行调整和优化。
[0029]在一个优选的实施方式中,步骤S4还包括以下步骤:
[0030]S4.1:根据业务需求和数据特点,选择模糊c均值聚类算法,确定用于聚类的变量,通过聚类分析方法确定聚类的个数;
[0031]S4.2:根据变量和数据特点,确定隶属函数,并依据聚类个数和数据量,初始化隶属度矩阵;
[0032]S4.3:通过隶属度矩阵和聚类中心的计算公式,进行多次迭代计算,直到收敛或达到预设迭代次数,获取隶属度矩阵和聚类中心,将不同的数据点划分到相应的聚类中。
[0033]本专利技术还提供一种基于模糊算法的用户数据采集系统,包括规则建立模块、排序模块、筛选模块、聚类模块、处理模块、存储模块;
[0034]所述规则建立模块根据数据类型和业务需求使用模糊逻辑和模糊推理来建立模糊规则,从模糊规则中获取产品的参数后,通过公式建立属性系数,所述排序模块将产品通过属性系数由大到小进行排序,生成优先级排序表,设定筛选阈值,所述筛选模块将属性系数小于筛选阈值的产品从排序表中删除,所述聚类模块通过模糊聚类算法为产品分入多个用户,所述处理模块通过可视化工具对分组结果分析和可视化,所述存储模块将用户数据存储在数据库中。
[0035]在上述技术方案中,本专利技术提供的技术效果和优点:
[0036]1、本专利技术通过数据类型和业务需求使用模糊逻辑和模糊推理来建立模糊规则,从模糊规则中获取产品的参数后,通过公式建立属性系数,将产品通过属性系数由大到小进行排序后,生成优先级排序表,从而提高对重要性大的用户特征数据的关注度,并且,将属性系数小于筛选阈值的产品从排序表中删除,降低企业计算量,从而降低计算成本,提高计算效率,且降低数据存储量;
[0037]2、本专利技术通过获取产品中的特征参数以及效益参数,将特征参数与效益参数通过公式计算后建立属性系数,将多项参数去除单位后综合处理,有利于提高数据处理效率,并且,若属性系数SX
i
<筛选阈值S
xz
,系本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于模糊算法的用户数据采集方法,其特征在于:所述采集方法包括以下步骤:S1:确定需要采集的用户数据类型,并根据数据类型和业务需求使用模糊逻辑和模糊推理来建立模糊规则;S2:从模糊规则中获取产品的参数后,通过公式建立属性系数,将产品通过属性系数由大到小进行排序生成优先级排序表;S3:设定筛选阈值,将属性系数小于筛选阈值的产品从排序表中删除;S4:使用模糊聚类算法为产品分入多个用户,并通过可视化工具对分组结果分析和可视化;S5:将用户数据存储在数据库中。2.根据权利要求1所述的一种基于模糊算法的用户数据采集方法,其特征在于:步骤S2中,建立所述属性系数包括以下步骤:获取产品中的特征参数以及效益参数,将特征参数与效益参数通过公式计算后建立属性系数,表达式为:式中,为特征参数,为效益参数,α、β分别为特征参数以及效益参数的比例系数,且α>β>0。3.根据权利要求2所述的一种基于模糊算法的用户数据采集方法,其特征在于:所述特征参数用于体现产品的用户感兴趣度,其中,Y
i
表示用户浏览产品数量,S
j
表示用户浏览产品时间,D
j
表示产品点击率。4.根据权利要求2所述的一种基于模糊算法的用户数据采集方法,其特征在于:所述效益参数效益参数用于体现产品的经济效益,其中,(XS
z
+PF
z
)表示产品的数据项权重系数,XS
z
表示销售量的权重系数,PF
z
表示用户评价分数的权重系数,(XS
g
+PF
g
)表示产品的数据项归一化值,XS
g
表示销售量的归一化值,PF
g
表示用户评价分数的归一化值。5.根据权利要求4所述的一种基于模糊算法的用户数据采集方法,其特征在于:所述销售量的归一化值XS
g
的计算公式为:式中,XS
i
为最近一段时间产品的销售量,XS
max
为产品的最大销售量,XS
min
为产品的最小销售量;所述用户评价分数的归一化值PF
z
的计算公式为:
式中,PF
i
为最近一段时间产品的用户评价分数,XS
max
为产品的最大用户评价分数,XS
min
为产品的最小用户评价分数。6...

【专利技术属性】
技术研发人员:张可彦
申请(专利权)人:南京优玛软件科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1