【技术实现步骤摘要】
一种异常体征的识别方法、装置、设备和存储介质
[0001]本专利技术涉及大数据分析
,具体而言,涉及一种异常体征的识别方法、装置、设备和存储介质。
技术介绍
[0002]用户在日常活动过程中会留存海量的健康体征数据,随着社会的发展,越来越多的健康数据进行了联网。例如,市民健康平台的构建,使得全市所有卫生机构都联网共享数据了,包括医院,疾控,社区卫生院。能够实现从没出生的孕检记录一直到死亡记录全部在卫健委平台共享数据。
[0003]随着健康数据的越来越多,如何利用这些数据为社会创造出新的价值,逐渐提上了日程。尤其是,如何利用这些健康数据,寻找出异常人群,形成异常体征态势感知,实现异常风险追踪和预警,变得尤为重要。
[0004]有鉴于此,申请人在研究了现有的技术后特提出本申请。
技术实现思路
[0005]本专利技术提供了一种异常体征的识别方法、装置、设备和存储介质,以改善相关技术中无法准确的从大量健康数据中,准确找出异常体征人员的问题。
[0006]第一方面、
[0007]本 ...
【技术保护点】
【技术特征摘要】
1.一种异常体征的识别方法,其特征在于,包含:获取体征数据;通过二分法更新所述体征数据的聚类数量,基于所述聚类数量,以误差平方和为依据,获取所述体征数据的分组数;根据所述分组数,对所述体征数据进行分组,以获得多个数据组;分别对各个所述数据组进行聚类处理,以获得异常数据;获取所述异常数据对应的身份信息,以获得初始异常人群;获取所述初始异常人群的体征数据的时序数据,以识别异常体征的最终异常人群。2.根据权利要求1所述的异常体征的识别方法,其特征在于,通过误差平方和,获取所述体征数据的分组数;其中,所述误差平方和的聚类数量通过二分法更新,具体包括:基于二分法,生成多个初始聚类数;分别计算所述多个初始聚类数的误差平方和,以获得拐点聚类数所在的区间;基于二分法,在所述区间中选取一个中间聚类数,并计算所述中间聚类数的误差平方和,然后根据所述中间聚类数的误差平方和更新所述区间,直至所述区间无法继续二分,以获得拐点聚类数;根据所述拐点聚类数,获取所述分组数。3.根据权利要求1所述的异常体征的识别方法,其特征在于,根据所述分组数,对所述体征数据进行分组,以获得多个数据组,具体包括:根据所述分组数,对所述体征数据进行分组,并对各个分组进行离散标记处理,以获得多个数据组;其中,所述离散标记处理为着色离散处理。4.根据权利要求1所述的异常体征的识别方法,其特征在于,分别对各个所述数据组进行聚类处理,以获得异常数据,具体包括:根据所述分组数,在各个所述数据组中选取对应数量的初始质心;基于所述数据组中各个数据点到所述初始质心的距离,进行聚类,以获得初始聚类簇;根据所述初始聚类簇,计算得到计算质心;基于所述数据组中各个数据点到所述计算质心的距离进行聚类,以获得计算聚类簇;根据所述计算聚类簇,计算并更新所述计算质心,直至计算质心的位置不再发生改变或者改变的距离小于预设值,完成对各个所述数据组的聚类处理,并获得各个所述数据组的聚类簇;根据各个所述数据组的聚类簇,获取各个所述数据组的正常数据范围;根据各个所述数据组的正常数据范围,从各个所述数据组中提取所述异常数据。5.根据权利要求1所述的异常体征的识别方法,其特征在于,获取所述初始异常人群的体征数据的时序数据,以识别异常体征的最终异...
【专利技术属性】
技术研发人员:皇甫潇潇,施建安,庄一波,程凌芳,徐艺,林家彬,
申请(专利权)人:厦门市易联众易惠科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。