【技术实现步骤摘要】
疾病异常数据检测方法及装置、计算机装置及存储介质
本专利技术涉及数据处理
,具体涉及一种疾病异常数据检测方法及装置、计算机装置和计算机可读存储介质。
技术介绍
随着全球经济一体化进程的加快,经济与交流活动增加,人群流动日益频繁,为疾病的传播与爆发提供了有利环境,公共卫生健康问题越来越严峻。同时,社会与自然环境也发生着变化,环境污染、自然灾害等影响公众健康事件的增多也增加了突发公共卫生事件爆发的可能性。如何检测出疾病异常数据,以便能够早期识别到疾病流行或爆发的突发公共卫生事件,尽早采取相应的控制措施,将突发公共卫生事件造成的损失降到最低,成为亟待解决的问题。现有的异常检测方法,例如zscore异常检测方法、格拉布斯(Grubbs)异常检测方法都要求数据满足正态分布,而实际上很多时候无法满足这个要求。对于传统的四分位法,会用到所有的数据,而过去久远的数据对当前数据的参考价值低,结果更容易出现偏差。
技术实现思路
鉴于以上内容,有必要提出一种疾病异常数据检测方法及装置、计算机装置和计算机可读存储介质,其可以实现高效准确的疾病监测数据异常检测。本申请的第一方面提供一种疾 ...
【技术保护点】
1.一种疾病异常数据检测方法,其特征在于,所述方法包括:获取时间点0到时间点t的疾病监测数据,构成时间序列数据X,X=[x0,x1,x2,…,xt];选取时间窗大小w,针对时间点w至时间点t中的每个时间点i,计算所述时间点i对应的时间窗内疾病监测数据的均值μi和标准差σi,所述时间点i对应的时间窗的大小为w,i=w,w+1,…,t;根据每个时间点i对应的时间窗内疾病监测数据的均值μi和标准差σi,计算所述时间点i对应的疾病监测数据xi的moving‑zscore值mzi,得到mz列表[mzw,mzw+1,mzw+2,…,mzt],其中
【技术特征摘要】
1.一种疾病异常数据检测方法,其特征在于,所述方法包括:获取时间点0到时间点t的疾病监测数据,构成时间序列数据X,X=[x0,x1,x2,…,xt];选取时间窗大小w,针对时间点w至时间点t中的每个时间点i,计算所述时间点i对应的时间窗内疾病监测数据的均值μi和标准差σi,所述时间点i对应的时间窗的大小为w,i=w,w+1,…,t;根据每个时间点i对应的时间窗内疾病监测数据的均值μi和标准差σi,计算所述时间点i对应的疾病监测数据xi的moving-zscore值mzi,得到mz列表[mzw,mzw+1,mzw+2,…,mzt],其中根据所述mz列表确定所述时间序列数据X的异常值阈值;判断时间点i对应的疾病监测数据xi的moving-zscore值是否大于所述异常值阈值,若时间点i对应的疾病监测数据xi的moving-zscore值大于所述异常值阈值,则所述时间点i对应的疾病监测数据xi为异常值。2.如权利要求1所述的方法,其特征在于,所述根据所述mz列表确定所述时间序列数据X的异常值阈值包括:计算所述mz列表的预设分位数或预设百分位数,将所述预设分位数或预设百分位数作为所述异常值阈值;或者计算所述mz列表的平均数,将所述平均数作为所述异常值阈值。3.如权利要求1所述的方法,其特征在于,所述方法还包括:获取其他的疾病异常数据检测方法对所述时间序列数据进行检测得到的异常值;将所述疾病异常数据检测方法得到的异常值与所述其他的疾病异常数据检测方法得到的异常值进行比较;根据所述疾病异常数据检测方法得到的异常值与所述其他的疾病异常数据检测方法得到的异常值的比较结果得到最终的异常值。4.如权利要求1所述的方法,其特征在于,所述方法还包括:分别对地区和地区下属医院进行疾病异常数据检测,得到针对地区的地区异常值和针对地区下属医院的地区下属医院异常值;比较所述地区异常值和所述地区下属医院异常值,根据所述地区异常值和所述地区下属...
【专利技术属性】
技术研发人员:阮晓雯,徐亮,肖京,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。