System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据处理方法、装置、设备及存储介质制造方法及图纸_技高网

数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:40488546 阅读:6 留言:0更新日期:2024-02-26 19:19
本申请关于一种数据处理方法、装置、设备及存储介质,涉及通信技术领域。该方法包括:根据多个第一采样点和第一区域边界,确定多个第二采样点;第一采样点为第一用户终端在第一预设时间段内的采样点;第一用户终端对应的用户为企业的正式员工;第一区域边界为企业所在区域范围对应的边界。根据多个第二采样点,确定第二区域边界。然后,获取多个第三采样点,并根据多个第三采样点,确定第二用户终端;第三采样点的采样时刻位于第一预设时间段内,且第三采样点位于第二区域边界内;第二用户终端对应的用户为企业的实习员工;之后,将第一用户终端的数量与第二用户终端的数量之和,确定为企业的员工数量。本申请用于准确确定企业员工数量。

【技术实现步骤摘要】

本申请涉及通信,尤其涉及一种数据处理方法、装置、设备及存储介质


技术介绍

1、获取企业的员工数量对于就业情况分析至关重要。由于企业上报存在不及时且不准确的情况,导致无法准确获取企业的员工数量。现有技术通常根据企业所在位置确定区域边界,并根据落入区域边界内的采样点确定企业员工数量。

2、但是,由于采样点存在定位误差,导致确定到的企业员工数量不准确。


技术实现思路

1、本申请提供一种数据处理方法、装置、设备及存储介质,以至少解决现有技术中由于采样点存在定位误差,导致确定到的企业员工数量不准确的问题。本申请的技术方案如下:

2、第一方面,提供一种数据处理方法,该方法包括:根据多个第一采样点和第一区域边界,确定多个第二采样点;第一采样点为第一用户终端在第一预设时间段内的采样点;第一用户终端对应的用户为企业的正式员工;第一区域边界为企业所在区域范围对应的边界;第二采样点位于第一区域边界内,或者,与区域边界的距离小于预设距离;根据多个第二采样点,确定第二区域边界;获取多个第三采样点,并根据多个第三采样点,确定第二用户终端;第三采样点的采样时刻位于第一预设时间段内,且第三采样点位于第二区域边界内;第二用户终端对应的用户为企业的实习员工;将第一用户终端的数量与第二用户终端的数量之和,确定为企业的员工数量。

3、在一种可能的实施方式中,上述根据多个第二采样点,确定第二区域边界,包括:根据多个第二采样点和预设聚类算法,确定目标簇;预设聚类算法包括:具有噪声的基于密度的聚类(density based spatial clustering of application with noise,dbscan)算法,或者,孤立森林(isolation forest)算法;根据目标簇,确定经度最大值、纬度最大值、经度最小值和纬度最小值;根据经度最大值、纬度最大值、经度最小值和纬度最小值,构建四边形,并将四边形确定为第二区域边界。

4、在一种可能的实施方式中,在预设聚类算法为具有噪声的基于密度的聚类算法的情况下,上述根据多个第二采样点和预设聚类算法,确定目标簇,包括:将多个第二采样点输入具有噪声的基于密度的聚类算法,得到至少一个聚类簇;在聚类簇的数量为多个的情况下,确定每个聚类簇的分布信息;分布信息包括:密度或者采样点数量;将多个聚类簇中分布信息满足预设条件的聚类簇,确定为目标簇;预设条件包括:密度大于预设密度,或者,采样点数量大于第一预设数量。

5、在一种可能的实施方式中,上述根据多个第三采样点,确定第二用户终端,包括:根据多个第三采样点,确定多个第三用户终端;第三用户终端对应的用户不为正式员工;针对每个第三用户终端,获取第四采样点的数量;第四采样点为第三用户终端在第二预设时间段内位于第二区域边界内的采样点;第二预设时间段大于第一预设时间段;在第四采样点的数量大于第二预设数量的情况下,将第三用户终端确定为第二用户终端。

6、在一种可能的实施方式中,上述根据多个第一采样点和第一区域边界,确定多个第二采样点,包括:针对每个第一采样点,判断第一采样点是否位于第一区域边界内;在第一采样点位于第一区域边界内的情况下,将第一采样点确定为第二采样点;在第一采样点不位于第一区域边界内的情况下,确定第一采样点与第一区域边界之间的距离,并在第一采样点与第一区域边界之间的距离小于预设距离的情况下,将第一采样点确定为第二采样点。

7、第二方面,提供一种数据处理装置,该数据处理装置包括:确定单元和获取单元;确定单元,用于根据多个第一采样点和第一区域边界,确定多个第二采样点;第一采样点为第一用户终端在第一预设时间段内的采样点;第一用户终端对应的用户为企业的正式员工;第一区域边界为企业所在区域范围对应的边界;第二采样点位于第一区域边界内,或者,与区域边界的距离小于预设距离;确定单元,还用于根据多个第二采样点,确定第二区域边界;获取单元,用于获取多个第三采样点;第三采样点的采样时刻位于第一预设时间段内,且第三采样点位于第二区域边界内;确定单元,还用于根据多个第三采样点,确定第二用户终端;第二用户终端对应的用户为企业的实习员工;确定单元,还用于将第一用户终端的数量与第二用户终端的数量之和,确定为企业的员工数量。

8、在一种可能的实施方式中,上述确定单元,具体用于:根据多个第二采样点和预设聚类算法,确定目标簇;预设聚类算法包括:具有噪声的基于密度的聚类算法,或者,孤立森林算法;根据目标簇,确定经度最大值、纬度最大值、经度最小值和纬度最小值;根据经度最大值、纬度最大值、经度最小值和纬度最小值,构建四边形,并将四边形确定为第二区域边界。

9、在一种可能的实施方式中,在预设聚类算法为具有噪声的基于密度的聚类算法的情况下,上述确定单元,具体用于:将多个第二采样点输入具有噪声的基于密度的聚类算法,得到至少一个聚类簇;在聚类簇的数量为多个的情况下,确定每个聚类簇的分布信息;分布信息包括:密度或者采样点数量;将多个聚类簇中分布信息满足预设条件的聚类簇,确定为目标簇;预设条件包括:密度大于预设密度,或者,采样点数量大于第一预设数量。

10、在一种可能的实施方式中,上述确定单元,具体用于:根据多个第三采样点,确定多个第三用户终端;第三用户终端对应的用户不为正式员工;针对每个第三用户终端,获取第四采样点的数量;第四采样点为第三用户终端在第二预设时间段内位于第二区域边界内的采样点;第二预设时间段大于第一预设时间段;在第四采样点的数量大于第二预设数量的情况下,将第三用户终端确定为第二用户终端。

11、在一种可能的实施方式中,上述确定单元,具体用于:针对每个第一采样点,判断第一采样点是否位于第一区域边界内;在第一采样点位于第一区域边界内的情况下,将第一采样点确定为第二采样点;在第一采样点不位于第一区域边界内的情况下,确定第一采样点与第一区域边界之间的距离,并在第一采样点与第一区域边界之间的距离小于预设距离的情况下,将第一采样点确定为第二采样点。

12、第三方面,提供一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现上述第一方面及其任一种可能的实施方式的方法。

13、第四方面,提供一种计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述第一方面中及其任一种可能的实施方式的方法。

14、第五方面,提供一种计算机程序产品,计算机程序产品包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行上述第一方面及其任一种可能的实施方式的方法。

15、本申请提供的第一方面的技术方案至少带来以下有益效果:现有技术中由于采样点存在定位误差,导致确定到的企业员工数量不准确。本申请根据多个第一采样点和第一区域边界,确定多个第二采样点。其中,第一采样点为第一用户终端在第一预设时间段内的采样点。第一用户终端对应的用户为企业的正式员工。第一区域边界为本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述多个第二采样点,确定第二区域边界,包括:

3.根据权利要求2所述的方法,其特征在于,在所述预设聚类算法为所述具有噪声的基于密度的聚类算法的情况下,所述根据所述多个第二采样点和预设聚类算法,确定目标簇,包括:

4.根据权利要求1所述的方法,其特征在于,根据所述多个第三采样点,确定所述第二用户终端,包括:

5.根据权利要求1-4中任一项所述的方法,其特征在于,所述根据多个第一采样点和第一区域边界,确定多个第二采样点,包括:

6.一种数据处理装置,其特征在于,包括:确定单元和获取单元;

7.根据权利要求6所述的装置,其特征在于,所述确定单元,具体用于:

8.根据权利要求7所述的装置,其特征在于,在所述预设聚类算法为所述具有噪声的基于密度的聚类算法的情况下,所述确定单元,具体用于:

9.根据权利要求6所述的装置,其特征在于,所述确定单元,具体用于:

10.根据权利要求6-9中任一项所述的装置,其特征在于,所述确定单元,具体用于:

11.一种电子设备,其特征在于,包括:

12.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中存储的计算机执行指令由电子设备的处理器执行时,所述电子设备能够执行如权利要求1-5中任一项所述的方法。

...

【技术特征摘要】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述多个第二采样点,确定第二区域边界,包括:

3.根据权利要求2所述的方法,其特征在于,在所述预设聚类算法为所述具有噪声的基于密度的聚类算法的情况下,所述根据所述多个第二采样点和预设聚类算法,确定目标簇,包括:

4.根据权利要求1所述的方法,其特征在于,根据所述多个第三采样点,确定所述第二用户终端,包括:

5.根据权利要求1-4中任一项所述的方法,其特征在于,所述根据多个第一采样点和第一区域边界,确定多个第二采样点,包括:

6.一种数据处理装置,其特征在于,包括:确定单元和获取单...

【专利技术属性】
技术研发人员:盛莉莉卜寅顾伟周奕昕张进张国光于洋祝海亮黎越
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1