一种基于ST-DBSCAN的职位时空数据分析方法技术

技术编号:20484815 阅读:33 留言:0更新日期:2019-03-02 18:56
本发明专利技术涉及一种基于ST‑DBSCAN的职位时空数据分析方法,属于时空数据聚类技术领域。先建立一个职位数据库,每一条数据作为一个对象点。然后将数据进行算法的计算,大致步骤如下:1.从库中选取一个不在任何簇中的时空核心对象pi;2.搜寻与pi时空直接密度可达对象qi,将qi加入新建的簇中;3.判断簇中的各对象是否为时空核心对象,是则重复上一步操作;4.重复上述所有步骤,直到数据库中所有对象都属于某个簇,或为时空孤立点。本发明专利技术与现有技术相比,主要提供了ST‑DBSCAN算法对挖掘时空职位数据时起到聚类分析作用,从而通过聚类得到的簇和孤立点,可以明显地展示出某个职位在某个时间段及地域的发展趋势。

【技术实现步骤摘要】
一种基于ST-DBSCAN的职位时空数据分析方法
本专利技术涉及一种基于ST-DBSCAN的职位时空数据分析方法,属于时空数据聚类

技术介绍
现代社会中,职位的种类多种多样,某一职位的需求量随着时间与地域的变化也有着相应的发展趋势,这是社会衍变与进步的基石。然而,各种职位的千变万化也给社会带来了一定的影响:人才分布不合理、社会与人才的供给矛盾、岗位与人才的技能需求矛盾等问题随之产生。ST-DBSCAN算法是扩展了DBSCAN的扫描维度,采用时空邻近域的概念去评估时空邻近域内的时空实体的密度。因此,ST-DBSCAN与DBSCAN一样,也是基于密度的时空聚类分析方法,与一些聚类算法相比,它不需要预先决定簇的数量,并可以发现任何形状的簇。时空数据的挖掘随着科技的进步变得尤其重要,时空聚类算法也已广泛应用于道路交通、犯罪统计、降雨规律等多个领域,但还没用应用到职位发展趋势的分析领域中。
技术实现思路
本专利技术要解决的技术问题是提供一种基于ST-DBSCAN的职位时空数据分析方法,将ST-DBSCAN算法应用到职位的发展趋势研究中来进一步分析各个职位随着时间与区域的不同而发生怎样的变本文档来自技高网...

【技术保护点】
1.一种基于ST‑DBSCAN的职位时空数据分析方法,其特征在于:Step1、建立一个三维的职位招聘数据库,库中就业地址的经度为x,纬度为y,职位发布时间为z,一条职位数据为一个对象点pi(x,y,z),i为职位序号,所有对象的集合为D;Step2、从D依次选取一个对象点pi(x,y,z),判断其是否已属于现有簇中,是则重新选取下一个对象点,否则进行下一步;Step3、判断对象点pi(x,y,z)是否为时空核心对象,是则进行下一步,否则回到Step2中重新选取下一个对象点;Step4、搜寻时空核心对象点pi(x,y,z)的所有时空相邻点qi,若qi不属于任何已有的簇,则将qi放入新建的簇A中,...

【技术特征摘要】
1.一种基于ST-DBSCAN的职位时空数据分析方法,其特征在于:Step1、建立一个三维的职位招聘数据库,库中就业地址的经度为x,纬度为y,职位发布时间为z,一条职位数据为一个对象点pi(x,y,z),i为职位序号,所有对象的集合为D;Step2、从D依次选取一个对象点pi(x,y,z),判断其是否已属于现有簇中,是则重新选取下一个对象点,否则进行下一步;Step3、判断对象点pi(x,y,z)是否为时空核心对象,是则进行下一步,否则回到Step2中重新选取下一个对象点;Step4、搜寻时空核心对象点pi(x,y,z)的所有时空相邻点qi,若qi不属于任何已有的簇,则将qi放入新建的簇A中,若qi属于已有的簇则不进行操作;Step5、判断簇A中的各对象是否为时空核心对象,若非时空核心对象则将其标为边缘时空对象不进行进一步操作,是则对该时空核心对象重复Step4的操作;Step6、重复上述步骤Step2到Step5的工作,直到D中所有对象都属于某个簇,或为时空孤立点;Step7、将上述得到的簇标签赋值给职位数据库新建的字段簇标签中;Step8、将数据库中所有对象的经度x、纬度y、时间z、簇标签分别展现到三维散点图对应点的横轴、纵轴、竖轴和点的颜色上。2.根据权利要求1所述的基于ST-DBSCAN的职位时空数据分析方法,其特征在于:所述步骤Step1中,三维的职位招聘数据库中每条职位信息都包含职位发布时间及就业地址的地理经度和纬度这三个字段,对象点pi(x,y,z)中的i为正整数...

【专利技术属性】
技术研发人员:宋耀莲田榆杰龙华王慧东徐文林武双新
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1