【技术实现步骤摘要】
生成筛查模型、筛查传染病高风险感染人群的方法及系统
本专利技术总体说来涉及人工智能领域,更具体地讲,涉及一种生成传染病高风险感染人群筛查模型的方法及系统、筛查传染病高风险感染人群的方法及系统。
技术介绍
目前,新型冠状病毒肺炎在全球大范围传染,随着时间的推进,世界多个国家已出现感染人群。此次疫情具有影响范围大,潜伏期长,重症率高等特点。从当前确诊人群来看,此次疫情的感染人群在年龄和性别上没有特别的分布,主要的传播途径是人与人之间的近距离传播。快速准确地判断出高风险感染人群进行观察是最有效控制疫情发展的手段之一。
技术实现思路
本专利技术的示例性实施例在于提供一种生成筛查模型、筛查传染病高风险感染人群的方法及系统,其能够用于快速准确地筛查某种传染病的高风险感染人群。根据本专利技术的示例性实施例,提供一种生成传染病高风险感染人群筛查模型的方法,其中,所述方法包括:获取训练数据集,其中,所述训练数据集包括用户轨迹信息,其中,所述用户轨迹信息是基于用户的移动终端相关数据获得的;建立样本表,其中,所述样本表中的每条样本包括用户标识和样本标签,样本标签指示用户为已确诊为感染/疑似感染指定类型传染病的正样本用户或为正常的负样本用户;基于所述训练数据集,为所述样本表中的各条样本分别提取特征,并将提取的特征并入所述样本表;使用机器学习算法,基于并入了特征的样本表进行机器学习模型训练,生成针对所述指定类型传染病的高风险感染人群筛查模型。可选地,所述用户轨迹信息包括:用户的移动终端在每个时间段所 ...
【技术保护点】
1.一种生成传染病高风险感染人群筛查模型的方法,其中,所述方法包括:/n获取训练数据集,其中,所述训练数据集包括用户轨迹信息,其中,所述用户轨迹信息是基于用户的移动终端相关数据获得的;/n建立样本表,其中,所述样本表中的每条样本包括用户标识和样本标签,样本标签指示用户为已确诊为感染/疑似感染指定类型传染病的正样本用户或为正常的负样本用户;/n基于所述训练数据集,为所述样本表中的各条样本分别提取特征,并将提取的特征并入所述样本表;/n使用机器学习算法,基于并入了特征的样本表进行机器学习模型训练,生成针对所述指定类型传染病的高风险感染人群筛查模型。/n
【技术特征摘要】
1.一种生成传染病高风险感染人群筛查模型的方法,其中,所述方法包括:
获取训练数据集,其中,所述训练数据集包括用户轨迹信息,其中,所述用户轨迹信息是基于用户的移动终端相关数据获得的;
建立样本表,其中,所述样本表中的每条样本包括用户标识和样本标签,样本标签指示用户为已确诊为感染/疑似感染指定类型传染病的正样本用户或为正常的负样本用户;
基于所述训练数据集,为所述样本表中的各条样本分别提取特征,并将提取的特征并入所述样本表;
使用机器学习算法,基于并入了特征的样本表进行机器学习模型训练,生成针对所述指定类型传染病的高风险感染人群筛查模型。
2.如权利要求1所述的方法,其中,所述用户轨迹信息包括:用户的移动终端在每个时间段所使用的基站的基站标识,
其中,各个时间段是按预设时间粒度划分特定时间跨度得到的。
3.如权利要求2所述的方法,其中,用户的移动终端在每个时间段所使用的基站为:用户的移动终端在每个时间段内使用时间最长的基站或用户的移动终端在每个时间段内的指定时间点所使用的基站。
4.如权利要求2所述的方法,其中,所述训练数据集包括以下数据表中的至少一项:
已确诊用户表,包括正样本用户的用户id及其确诊时间;
用户轨迹表,包括用户id及用户的移动终端在每个时间段所使用的基站的基站id;
用户信息表,包括用户id及用户的属性信息;
基站表,包括基站id及基站的地理位置信息;
用户通信记录表,包括用户id及用户使用移动终端与其他移动终端的用户的通信记录;
用户通讯录信息表,包括用户id及用户的移动终端的至少一个应用的通讯录中的联系人的用户id。
5.如权利要求4所述的方法,其中,基于所述训练数据集为所述样本表中的各条样本分别提取特征的步骤包括:
将所述训练数据集所包括的数据表中的信息直接处理为与各个用户id分别对应的基础特征;
和/或,基于所述训练数据集所包括的数据表中的信息生成与各个用户id分别对应的衍生特征,其中,所述衍生特征包括以下项之中的至少一项:关于用户的活动活跃程度的聚合特征、关于用户与正样本用户的社交亲密度的聚合特征、关于用户与正样本用户在同一时间段出现在同一基站区域的聚合特征、关于用户出现在易感染区域的聚合特征,
其中,用户在一时间段出现的基站区域为该用户的移动终端在该时间段所使用的基站所对应的区域,易感染区域为各个正样本用户在各个时间段出现过的基站区域。
6.一种筛查传染病高风险感染人群的方法,其中,所述...
【专利技术属性】
技术研发人员:罗远飞,蔡恒兴,钟润兴,李京,花彬,涂威威,
申请(专利权)人:第四范式北京技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。