【技术实现步骤摘要】
一种体温序列职业画像新方法
本专利技术属于机器学习领域,涉及基于特征距离的聚类方法,具体是一种体温序列职业画像新方法。
技术介绍
一些重点行业(如厨师、保安、护工等)长期与高流动人群密切接触,是疫情防控工作中的关注点,做好这些行业人群的特征分析有助于辅助实现新冠筛查。由于体温序列是一种相对容易获取且能够实时观测的健康指标,可以针对长期体温序列进一步挖掘高层次特征,使用这些特征衡量不同重点行业人群的温度变化模式,从而辅助筛查不同行业的异常体温序列,使新冠感染人员的检测工作更加便利。
技术实现思路
目前机器学习领域没有使用体温时间序列进行职业画像的方法,且在实际体温监测中存在着体温数据缺失、数据精度不高以及体温特征直接信息不够等问题。为了克服以上问题,本专利技术提出了基于时间序列平稳性检验的异常体温序列筛选方案,具体是一种体温序列职业画像新方法。所述的体温序列职业画像新方法,具体步骤如下:步骤一、针对某个目标用户,从体温数据库中提取固定时间段内的体温序列值生成该用户的体温时间序列数据集;具体是指:对该用户每隔半小时进行一次体温采样,将半小时内的体温均值作为体温序列值,将固定时间段内的所有体温序列值构成该用户的体温时间序列数据集。步骤二、判断该体温时间序列数据集是否缺失,如果是,对缺失的体温序列值进行补足,生成完整的体温时间序列数据,进入步骤三;否则,直接进入步骤三;补足缺失温度的具体步骤如下:步骤201、针对缺失的体温序列值,找到序列值对应的时间 ...
【技术保护点】
1.一种体温序列职业画像新方法,其特征在于,具体步骤如下:/n步骤一、针对某个目标用户,从体温数据库中提取固定时间段内的体温序列值生成该用户的体温时间序列数据集;/n步骤二、判断该体温时间序列数据集是否缺失,如果是,对缺失的体温序列值进行补足,生成完整的体温时间序列数据,进入步骤三;否则,直接进入步骤三;/n补足缺失温度的具体步骤如下:/n步骤201、针对缺失的体温序列值,找到序列值对应的时间段α;/n步骤202、寻找该时间段α之前最近的两个有效温度序列值对应的时间段和之后最近的两个有效温度序列值对应的时间段;/n该时间段α之前和之后的有效序列值对应的四个时间段,均与时间段α的间隔不超过24小时;/n步骤203、针对四个有效温度序列值对应的时间段,根据距离时间段α的时间间隔来计算权重值,并做加权平均得到第一插值温度;/n具体为:/n首先,分别计算每个有效时间段与时间段α的时间差,时间差中包含的半小时个数即为时间间隔;/n利用时间间隔计算该有效时间段的权重;/n计算公式为:
【技术特征摘要】
1.一种体温序列职业画像新方法,其特征在于,具体步骤如下:
步骤一、针对某个目标用户,从体温数据库中提取固定时间段内的体温序列值生成该用户的体温时间序列数据集;
步骤二、判断该体温时间序列数据集是否缺失,如果是,对缺失的体温序列值进行补足,生成完整的体温时间序列数据,进入步骤三;否则,直接进入步骤三;
补足缺失温度的具体步骤如下:
步骤201、针对缺失的体温序列值,找到序列值对应的时间段α;
步骤202、寻找该时间段α之前最近的两个有效温度序列值对应的时间段和之后最近的两个有效温度序列值对应的时间段;
该时间段α之前和之后的有效序列值对应的四个时间段,均与时间段α的间隔不超过24小时;
步骤203、针对四个有效温度序列值对应的时间段,根据距离时间段α的时间间隔来计算权重值,并做加权平均得到第一插值温度;
具体为:
首先,分别计算每个有效时间段与时间段α的时间差,时间差中包含的半小时个数即为时间间隔;
利用时间间隔计算该有效时间段的权重;
计算公式为:
k为时间间隔数;wk表示距离当前时间段k×0.5个小时体温数据的权重;
然后,根据四个权重值将对应的四个有效温度值做加权平均,得到第一插值温度;
计算公式如下:
C是间隔数k的长度为4的取值集合;tempk代表目标用户的权重wk对应的有效温度值,tempavg是缺失值时间段对应的第一插值温度;
步骤204、同时,对于四个有效温度值对应的时间段,分别统计这四个时间段内所有用户的体温均值;
步骤205、将每个有效温度值与各自对应的体温均值做差,对差值赋予该时间段对应的权重后对四个时间段做加权平均,从而计算出目标用户体温与大众均值的平均差距;
步骤206、用时间段α对应的全体用户体温的均值加上平均差距,即得到第二插值温度;
计算公式如下:
diffk=total_tempk-tempk
其中diffk代表权重wk对应时间段内目标用户的温度有效值与全体用户温度均值的差值;total_tempk代表权重wk对应的时间段全体用户有效温度的平均值;tempdiff是缺失值时间段对应的、基于前后四个时间段有效温度值与全体用户温度均值差距的第二插值温度;
步骤207、取第一插值温度和第二插值温度的均值补入到缺失的体温时间序列数据集中,生成完整的体温时间序列数据;
步骤三、使用完整的体温时间序列数据生成目标用户的五维高层次特征;
步骤四、将五维高...
【专利技术属性】
技术研发人员:赵志诚,苏菲,陈冠宇,陈冲,
申请(专利权)人:北京邮电大学,北京微芯边缘计算研究院,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。