基于公共空间服务的数据采集和项目运营分析系统技术方案

技术编号:39677630 阅读:6 留言:0更新日期:2023-12-11 18:54
本发明专利技术公开一种基于公共空间服务的数据采集和项目运营分析系统,采用电商指标分析方法进行数据采集和项目运营分析,方法包括:设备部署与连接

【技术实现步骤摘要】
基于公共空间服务的数据采集和项目运营分析系统


[0001]本专利技术属于项目运营分析领域,具体是指一种基于公共空间服务的数据采集和项目运营分析系统


技术介绍

[0002]线下公共空间服务项目运营活动的竞争越来越激烈,激烈的竞争促进了数据采集和项目运营分析系统的发展,如何采集线下公共空间服务项目运营活动的相关数据并进行业务层面所需要的数据分析也受到越来越多的关注

[0003]现有的项目运营分析系统基本都是针对线上运营活动,线上运营活动通常使用网站埋点的方法获取用户的行为数据

但线下公共空间服务项目运营活动与线上运营活动不同,线下公共空间服务项目运营活动缺少针对现场部署并采集特定数据的硬件设备系统;
[0004]现有的数据采集和项目运营分析系统依托于前置获得的直接输入,数据较为原始,格式杂乱,有空数据

脏数据和重复数据的存在

原始数据没有经过统一的整合与清洗,难以保证每次线下公共空间服务项目运营活动收集到的信息种类和详细条目是规范的且能被数据存储层所接受的;
[0005]数据分析经常需要对比之前线下公共空间服务项目运营活动的历史数据,针对本次线下公共空间服务项目运营活动的数据指标的效果评估,可以在排除每次线下公共空间服务项目运营活动不确定性和不可复现的基础上,确认此次针对线下公共空间服务项目运营活动的优化修改方案是否对线下公共空间服务项目运营活动举办的效果产生了影响,是否具有正面作用,是否获得了正面增益等问题仅凭单次活动的数据对比或者个人积累的活动经验来做出一个主观性的判决是不准确的;
[0006]大量的数据流使人感到疲惫,文字承载的信息有限,人不必可避免地产生视觉疲劳,抵触单纯的文本数据,导致决策管理人员无法获取准确的数据信息并做出项目决策


技术实现思路

[0007]针对上述情况,为克服现有技术的缺陷,本专利技术提供了一种基于公共空间服务的数据采集和项目运营分析系统

[0008]本专利技术采用人体感应模块和人脸识别模块别相结合的方式,科学部署终端节点设备,提供一种基于公共空间的人流量数据采集方法

本专利技术采用
Python
生态第三方库对原始数据进行清洗,采用了一种基于统计学原理的
AB
测试方案,提供一种借助
Power BI
的信息流可视化方案,有效提高决策者输入输出信息的体验

[0009]本专利技术采取的技术方案如下:本专利技术提供了一种基于公共空间服务的数据采集和项目运营分析系统,采用电商指标分析方法进行数据采集和项目运营分析,所述基于公共空间服务的数据采集和项目运营分析系统包括数据采集层

数据处理层

数据存储层

数据分析层和数据展示层

[0010]所述数据采集层采用终端节点设备进行数据采集,数据采集层的数据包括终端节
点设备采集的数据信息和后台订单记录,终端节点设备包括以线下公共空间服务项目运营活动为中心

预设距离为半径的边界设置的多对人体感应模块
A、
线下公共空间服务项目运营活动的内场入口处设置的人体感应模块
B
和线下公共空间服务项目运营活动的内场入口处设置的人脸识别模块

[0011]将人体感应模块
A
采集到的原始数据定义为数据
a
,数据
a
即以项目运营活动为中心

预设距离为半径的边界人流量;将人体感应模块
B
采集到的原始数据定义为数据
b
,数据
b
即内场入口处人流量;将人脸识别模块采集到的原始数据定义为数据
c
,数据
c
包括用户
ID_a
,人脸信息

进入进出标记和记录时间;将后台订单记录定义为数据
d
,数据
d
包括编号

订单
ID、
用户
ID_b、
下单时间

品类号

件数和订单总价

[0012]终端节点设备采集的数据
a、
数据
b、
数据
c
和数据
d
和后台订单记录通过
IEEE 802.15.1
传递给网关,网关采用
TCP/IP
协议链接网络服务器;
[0013]所述数据处理层整合数据
a、
数据
b、
数据
c
和数据
d
为连续用户行为数据,对连续用户行为数据进行清洗和预处理操作,得到初步观测指标;
[0014]所述数据存储层由网关和网络服务器组成,网络服务器设有数据库,存储连续用户行为数据和初步观测指标;
[0015]所述数据分析层调用并分析连续用户行为数据和初步观测指标形成高级观测指标,使用
RFM
模型对用户进行分类,形成用户分类数据;
[0016]所述数据展示层采用
Power BI
数据分析工具与数据库建立连接,完成可视化展示;
[0017]所述电商指标分析方法包括以下步骤:
[0018]步骤
S1
:设备部署与连接,将终端节点设备部署到线下公共空间服务项目运营活动区域;
[0019]步骤
S2
:数据采集与传输,数据
a、
数据
b、
数据
c
和数据
d
经过整合形成连续用户行为数据,连续用户行为数据经过清洗和预处理后形成初步观测指标,连续用户行为数据和初步观测指标通过
IEEE 802.15.1
传递给网关,网关采用
TCP/IP
协议链接网络服务器,将连续用户行为数据和初步观测指标交给网络服务器,网络服务器将其存储至数据库中;
[0020]步骤
S3
:数据处理与数据分析,数据分析层访问数据库中的连续用户行为数据和初步观测指标并进行分析整理,形成高级观测指标和用户分类数据,并将高级观测指标和用户分类数据保存到数据库中;
[0021]步骤
S4
:数据可视化与展示,利用
Power BI
实现连续用户行为数据

初步观测指标

高级观测指标和用户分类数据的可视化

[0022]作为本方案的进一步改进,在步骤
S1
中,设备部署与连接具体包括以下步骤:
[0023]步骤
S11
:在线下公共空间服务项目运营活动辐射范围区域设置人体感应模块
A...

【技术保护点】

【技术特征摘要】
1.
基于公共空间服务的数据采集和项目运营分析系统,所述系统包括数据采集层

数据处理层

数据存储层

数据分析层和数据展示层,其特征在于:所述数据采集层采用终端节点设备进行数据采集,数据采集层的数据包括终端节点设备采集的数据信息和后台订单记录,终端节点设备包括以线下公共空间服务项目运营活动为中心

预设距离为半径的边界设置的多对人体感应模块
A、
线下公共空间服务项目运营活动的内场入口处设置的人体感应模块
B
和线下公共空间服务项目运营活动的内场入口处设置的人脸识别模块;人体感应模块
A
采集到的原始数据定义为数据
a
,数据
a
即以项目运营活动为中心

预设距离为半径的边界人流量;人体感应模块
B
采集到的原始数据定义为数据
b
,数据
b
即内场入口处人流量;人脸识别模块采集到的原始数据定义为数据
c
,数据
c
包括用户
ID_a
,人脸信息

进入进出标记和记录时间;将后台订单记录定义为数据
d
,数据
d
包括编号

订单
ID、
用户
ID_b、
下单时间

品类号

件数和订单总价;终端节点设备采集的数据
a、
数据
b、
数据
c
和数据
d
和后台订单记录通过
IEEE 802.15.1
传递给网关,网关采用
TCP/IP
协议链接网络服务器;所述数据处理层整合数据
a、
数据
b、
数据
c
和数据
d
为连续用户行为数据,对连续用户行为数据进行清洗和预处理操作,得到初步观测指标;所述数据存储层由网关和网络服务器组成,网络服务器设有数据库,存储连续用户行为数据和初步观测指标;所述数据分析层调用并分析连续用户行为数据和初步观测指标形成高级观测指标,使用
RFM
模型对用户进行分类,形成用户分类数据;所述数据展示层采用
Power BI
数据分析工具与数据库建立连接,完成可视化展示;所述基于公共空间服务的数据采集和项目运营分析系统采用电商指标分析方法进行数据采集和项目运行分析,所述电商指标分析方法包括以下步骤:步骤
S1
:设备部署与连接,将终端节点设备部署到线下公共空间服务项目运营活动区域;步骤
S2
:数据采集与传输,数据
a、
数据
b、
数据
c
和数据
d
经过整合形成连续用户行为数据,连续用户行为数据经过清洗和预处理后形成初步观测指标,连续用户行为数据和初步观测指标通过
IEEE 802.15.1
传递给网关,网关采用
TCP/IP
协议链接网络服务器,将连续用户行为数据和初步观测指标交给网络服务器,网络服务器将其存储至数据库中;步骤
S3
:数据处理与数据分析,数据分析层访问数据库中的连续用户行为数据和初步观测指标并进行分析整理,形成高级观测指标和用户分类数据,并将高级观测指标和用户分类数据保存到数据库中;步骤
S4
:数据可视化与展示,利用
Power BI
实现连续用户行为数据

初步观测指标

高级观测指标和用户分类数据的可视化
。2.
根据权利要求1所述的一种基于公共空间服务的数据采集和项目运营分析系统,其特征在于:在步骤
S1
中,设备部署与连接包括以下步骤:步骤
S11
:在线下公共空间服务项目运营活动辐射范围区域设置人体感应模块
A
,采集数据
a

步骤
S12
:在线下公共空间服务项目运营活动的内场入口处设置人体感应模块
B
和人脸识别模块,采集数据
b
和数据
c
;步骤
S13
:将数据
a、
数据
b、
数据
c
和数据
d
整合关联,作为多个独立用户在线下公共空间服务项目运营活动的连续用户行为数据进行分析;步骤
S14
:将连续用户行为数据传递给数据处理层
。3.
根据权利要求2所述的一种基于公共空间服务的数据采集和项目运营分析系统,其特征在于:在步骤
S2
中,所述数据采集与传输具体包括以下步骤:步骤
S21
:本发明使用
Python
生态科学计算第三方库
pandas、numpy

scipy
对连续用户行为数据进行清洗,有效去除空数据

脏数据和重复数据,提高数据的规范性和统一性;步骤
S22
:采用分布式计算,对清洗后的连续用户行为数据进行预处理操作,将经过清洗和预处理的连续用户行为数据导出为
CSV
格式并存储至网络服务器
。4.
根据权利要求3所述的一种基于公共空间服务的数据采集和项目运营分析系统,其特征在于:在步骤
S22
中,所述预处理具体包括以下步骤:步骤
S221
:初步分析计算经过清洗后的连续用户行为数据,形成初步观测指标,初步观测指标包括付费人数

消费总量
GMV、
最终成单量

运营转化率

访问时长
、PV
访问量和
UV
独立访客;步骤
S222
:计算运营转化率

访问时长
、PV
访问量和
UV
独立访客,所用公式如下:式中,
OCR
代表运营转化率,
PF_entrance
代表线下公共空间服务项目运营活动的内场入口处人流量,
PF_range
代表以线下公共空间服务项目运营活动为中心

预设距离为半径的边界人流量;式中,
LOV
代表访问时长,
DT
代表内场入口离开时间,
ET
代表内场入口进入时间;
PV
访问量:对一段时间内的所有访问线下公共空间服务项目运营活动的客户总数;
UV
独立访客:对一段时间内的所有访问线下公共空间服务项目运营活动的客户去重后的总数
。5.
根据权利要求4所述的一种基于公共空间服务的数据采集和项目运营分析系统,其特征在于:在步骤
S3
中,数据处理与分析,具体包括以下步骤:步骤
S31
:将清洗后的连续用户行为数据作为样本,将清洗后的连续用户行为数据的数量作为样本量,在本发明中,最小样本量是指科学有效地表达优化修改方案对项目运营活动举办的效果产生了影响所需要的最少数量;收集调用优化修改方案前的样本,作为对照组;步骤
S32
:分析优化修改方案前的样本,作出优化改进的假设,提出优化建议;步骤
S33
:确定绩效指标,绩效指标包括消费总量
GMV、
复购率
、ARPU
人均消费价格和
ARPPU
每付费用户平均收益;步骤
S34
:将连续用户行为数据和初步观测指标记为资源,将绩效指标记为奖励,采用基于
UCB
和条件推理树的
AB
测试资源动态分配算法进行优化修改方案;步骤
S35
:计划并实施应用优化修改方案后的线下公共空间服务项目运营活动,并采集优化修改方案后的样本,作为实验组;步骤
S36
:每个组的最小样本量计算如下:式中,
δ
代表的是预期实验组和对照组两组数据的差值,
α
是犯第一类错误的概率,通常
α
取值
0.05
,即置信度是1‑
α

0.95
%,
β
是第二类错误的概率,
β
取值
0.2
,即统计功效的取值1‑
β

0.8

σ
代表的是样本的标准差,衡量的是样本的波动性,可以由计算样本的标准差计算得到;当绩效指标为绝对值
/
比率指标时,样本的标准差的计算公式:
σ2=
P
A
(1

P
A
)+P
B
(1

P
B
)
式中,
PA
是对照组的观测数据;
PB
为实验组的观测数据;步骤
S37
:判断优化修改方案效果的可信性和有效性,即判断样本量是否已经大于或等于所需要的最小样本量:如果样本量大于或等于所需要的最小样本量,则能够以1‑
α
的置信度得出优化修改方案对项目运营活动的效果产生影响的结论;如果样本量小于所需要的最小样本量,则得出优化修改方案对项目运营活动的效果产生影响的结论是不准确的,样本量需要大于或等于最小样本量才允许接下来数据分析层的操作
。6.
根据权利要求5所述的一种基于公共空间服务的数据采集和项目运营分析系统,其特征在于:在步骤
S34
中,采用基于
UCB
和条件推理树的
AB
测试资源动态分配算法具体包括以下步骤:步骤
S341
:在活动开始前,将历史项目运营活动收集的资源作为训练集;条件推理树的目的是正确地识别出哪些资源和奖励之间的联系是类似的;将奖励记为因变量,资源记为自变量;首先对训练集的因变量和每个自变量进行卡方检验,计算
p
值公式如下:
p
=1‑
P(
χ2>
χ
02
)
其中,...

【专利技术属性】
技术研发人员:黄伟王作辉赵奎
申请(专利权)人:知识空间广州数字科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1