【技术实现步骤摘要】
一种个体健康与公共卫生数据时空聚集可视化构建方法及平台
本专利技术针对个体健康数据与公共卫生数据的关联可视化,给出一套面向时空聚集问题的可视化方法。引入半结构化建模方法构建个体健康数据的可扩展描述框架,基于通用POI的地名和空间字段构建不同粒度和不同质量的地址映射信息,并基于个人健康设备采集的位置信息周期性地更新用户的地址信息,采用文本相似匹配实现个体健康和公共卫生数据的空间信息标准化,使得不同来源的个体健康和公共卫生数据能够统一呈现于主流三维GIS平台上。
技术介绍
1)随着移动应用、人工智能和卫生信息化的快速发展,涵盖个体健康和公共卫生的健康医疗大数据来源越来越多样化、数据用途日益广泛、异构数据关联模式日渐复杂。为推动这类健康医疗大数据的有效应用,国内外正逐渐建立与具体应用相适配的规范和标准。为促进基本公共卫生服务逐步均等化,我国正逐步完善和推广《国家基本公共卫生服务规范》,指导乡镇卫生院、村卫生室和社区卫生服务中心(站)等城乡基层医疗卫生机构为居民免费提供基本公共卫生服务。健康医疗大数据标准研究院通过设于OMA ...
【技术保护点】
1.一种个体健康与公共卫生数据时空聚集可视化平台,其特征在于,包括:/n客户端:用于根据健康卫生分类构建分析业务,所述健康卫生分类数据包括个体就医信息(SP)、医疗设施信息(PF)、医疗器械信息(PD)、药物配备信息(PM)和医疗人员信息(PP);/n移动端:用于存储一类个体健康信息(SH)以及个人位置信息;/n服务器端:将健康卫生分类数据和一类个体健康信息(SH)进行六类信息建模,通过分层编码将健康卫生分类数据进行标识后存储在服务器,然后与个体健康信息通过健康医疗实体标识码进行统一前缀编码,得到分类信息;并提取个人位置信息中的地址部分,通过地址映射坐标库进行相似匹配得到标 ...
【技术特征摘要】
1.一种个体健康与公共卫生数据时空聚集可视化平台,其特征在于,包括:
客户端:用于根据健康卫生分类构建分析业务,所述健康卫生分类数据包括个体就医信息(SP)、医疗设施信息(PF)、医疗器械信息(PD)、药物配备信息(PM)和医疗人员信息(PP);
移动端:用于存储一类个体健康信息(SH)以及个人位置信息;
服务器端:将健康卫生分类数据和一类个体健康信息(SH)进行六类信息建模,通过分层编码将健康卫生分类数据进行标识后存储在服务器,然后与个体健康信息通过健康医疗实体标识码进行统一前缀编码,得到分类信息;并提取个人位置信息中的地址部分,通过地址映射坐标库进行相似匹配得到标准化坐标,得到空间信息;然后将得到的分类信息、获取时刻、空间信息和信息生成人作为每条数据的基础信息,并根据信息所属的类别填充每条数据除基础信息外的其他字段;最后,尽管字段构成显著不同,但不同类别的数据由于均具有同构的基础信息,因而在常见的NoSQL数据库的同一记录集中并存。
2.根据权利要求1所述的一种个体健康与公共卫生数据时空聚集可视化平台,其特征在于,健康医疗实体标识码是基于统一模式和健康医疗实体标识码对不同公共卫生和个体健康数据进行统一管理:通过信息来源找到每条记录所属的医疗实体类别,通过前缀+医疗码的方式构建记录实体在设定的分析标识码,即实体码,具体步骤是:
步骤2.1、考虑全局码采用64字节ASCII字符构成,前缀部分8个字符用来区分记录的分类(已有两个字符的分配见上面权利要求1中六种分类,剩余8个字符填充符号“#”待未来扩展);
步骤2.2、针对医疗要素的子类标准形成全局码的后续56个字符内容,不足56字符的采用前缀补充“#”的方式补齐全局码;
a.药品编码前缀为“PM######”;后续药品类别标识采用14位构成,由药品国别码、药品类别码、药品本体码和校验码依次连接构成;这里前缀42个字符使用“#”保留对其他药品分类体系或国家药品分类方法的扩展;
b.对于医疗器械编码,采用前缀“PD######”,其中一级产品类别和二级产品类别之间采用“-”分割,依次类推;
c.针对医疗人员和医疗设施,分别采用前缀“PP######”和“PF######”随后跟随医疗人员或设施标识部分采用48字节构成,其中前16字节用于标识人员或设施所在医疗实体的组织机构代码;48字节人员或设施标识的后32字节用于标识给定医疗结构内部的人员或设施编码;
d.个体信息中个体就医和个体健康分别采用SP######和SH######作为前缀标识,身份证作为个体标识,以后缀方式填充个体就医和个体健康码。
3.根据权利要求1所述的一种个体健康与公共卫生数据时空聚集可视化平台,其特征在于,标准化坐标的具体获取方式是:给定个人健康记录,提取其中的家庭住址字段;通过城市小区POI和其他地址信息构建二级地址库,并基于地址映射坐标库进行地址字段的匹配,得到个人的空间坐标信息,具体步骤是:
步骤3.1、构建城市住宅小区一级地址→坐标库和其他POI二级地址→坐标库;
步骤3.2、分别在一级库和二级库上建立2-gram索引;
步骤3.3、当地址请求到达时,首先去除地址库中城市名称,然后尝试提取区、街道、小区关键词,对于有道路信息和机构名称的提取道路名称和机构名称;基于小区名称在一级库中以2-gram进行关键词检索;
步骤3.4、若一级库中无法匹配到记录,依次查询给定组织的所有2-gram,并将每个2-gram所包含的候选记录进行合并,得到每个候选记录与被查询记录的2-gram匹配数量,若匹配数量不小于被查询数量的2-gram的2/3、则保留该候选记录;按照2-gram的匹配个数,对所有候选记录排序,并将匹配数量最高的候选记录作为最终的住宅地址,将该候选记录的坐标作为被查询地址的坐标。
4.根据权利要求1所述的一种个体健康与公共卫生数据时空聚集可视化平台,其特征在于,服务器端还能够实时更新个人位置,具体是:
步骤4.1、个人位置获取,对于通过移动端提供个人位置信息的用户,维护一个用户位置的列表、并以追加方式不断追加用户的位置信息和获取时间;具体流程如下:
a.创建一个用户位置哈希结构,主键为用户ID,键值为一个位置和获取时间的列表;
b.当在某一时刻获取到用户的位置信息后,基于用户的ID寻址到用户的位置列表,追加一个<当前位置,当前时间>元组;
c.迭代执行b完成对用户位置的时空记录;
步骤4.2、历史位置信息;针对增量追加的个人位置信息,周期分析得到注册用户的家庭住址,基本原理是统计夜晚用户的坐标信息,并按坐标范围的频率排序得到精确的地址坐标;具体步骤如下:
a.以日为周期,在每日12:00时刻遍历步骤1中a创建的位置列表;
b.获取当天0:00时刻至6:00的用户位置信息;若位置信息超过一个,则以设定矩形范围进行分组计数;
c.针对每天每个用户在b中的统计计数,挑选频度最高的矩形作为当日用户的居住区域;若仅有一条记录则以记录的位置点为中心,以b中给定的矩形范围对中心进行扩展得到居住区域;
d.以月为单位对c中得到的用户每日居住区域进行扫描得到月居住地,扫描确定月居住区域的细节参加H8;
步骤3、基于经过分析的住址,对地址映射坐标库进行更新,向小区库中插入当前用户的住址文本,分析得到的坐标信息,以便于后续其他临近用户的坐标提取。
5.根据权利要求1所述的一种个体健康与公共卫生数据时空聚集可视化平台,其特征在于,统一模式描述是得到的分类信息和空间信息,构建全局统一的模式描述,统一描述所有记录的公共字段并根据分类不同追加特性字段,形成健康医疗记录,公共字段含分类信息、空间信息、时间信息、主体信息;具体步骤是:
步骤1、根据得到任意记录所在实体的编码及其分类信息、人员住址或根据组织机构所在的地址得到器械或药品的地址;以及当前产生记录的操作人员标识和获取时间,形成基础信息;
步骤2、以字段名+字段值的方式将不同子类的特殊属性信息附着于步骤1的基础信息上,形成一条Key-Value描述的健康医疗记录;
步骤3、可视化平台可以基于空间信息对任意类别或指定的子类对所有数据集进行查询,对结果中的空间字段可以完成空间统计、通过分割不同粒度的时间字段可以看到空间统计的时态变化态势。
6.一种个体健康与公共卫生数据时空聚集可视化构建方法,其特征在于,包括
步骤1、基于统一模式和健康医疗实体标识码实体码对不同公共卫生和个体健康数据进行统一管理:通过信息来源找到每条记录所属的医疗实体类别,通过前缀+医疗码的方式构建记录实体的实体码;
步骤2、给定个人健康记录,如监控得到的个人健康信息或移动端注册就医信息等,提取其中的家庭住址字段;通过城市小区POI和其他地址信息构建二级地址库,并基于地址映射坐标库进行地址字段的匹配,得到个人的空间坐标信息;
步骤3、个人位置获取,该步骤为可选项;对于通过移动端提供个人位置信息的用户,维护一个用户位置的列表、并以追加方式不断追加用户的位置信息和获取时间;
步骤4、历史位置信息;针对增量追加的个人位置信息,周期分析得到注册用户的家庭住址,基本原理是统计夜晚用户的坐标信息,并按坐标范围的频率排序得到精确的地址坐标;
步骤5、基于经过分析的住址,对地址→坐标库进行更新,向小区库中插入当前用户的<住址文本,分析得到的坐标信息>,以便于后续其他临近用户的坐标提取;
步骤6、基于步骤1和2得到的分类信息和空间信息,构建全局统一的模式描述,统一描述所有记录的公共字段并根据分类不同追加特性字段,形成健康医疗记录,其中,公共字段包括分类信息、空间信息、时间信息、主体信息,具体是:
1)将得到的分类信息、获取时刻、空间坐标和信息生成人作为每条数据的基础信息;
2)根据信息所属的类别填充每条数据除基础信息外的其他字段;
3)尽管字段构成显著不同,但不同类别的数据由于均具有同构的基础信息,在常见的NoSQL数据库的同一存储所有记录并创建索引;
4)针对给定的空间范围、时间范围和主题条件对记录进行查询,并返回聚集统计结果;
5)在GIS平台上,将结果给出的统计值按照一定的可视化方式呈现给用户。
7.根据权利要求6所述的一种个体健康与公共卫生数据时空聚集可视化构建方法,其特征在于,步骤1中健康医疗标识码的具体构建方法是:
步骤1、构建健康医疗数据库,采用NoSQL方式定义记录格式为可扩展的,并预定义五个基础字段:主键、分类编码、空间编码、创建时间和用户ID;
步骤2、根据到来记录的业务系统,生成记录的分类编码:采用预设前缀个体就医:SP、个体健康信息:SH、医疗设施:PF、医疗器械:PD、药物配备:PM和医疗人员:PP六个大类;为不同类型的业务记录生成健康医疗标识码;
步骤3、以分类为基础,提取记录的其他基础字段形成统一描述记录的基础字段,其中,其他基础字段包括空间编码、时间信息、主体信息和记录ID;
步骤4、将不同分类记录的特性字段作为记录的扩展字段追加到记录中;
步骤5、将记...
【专利技术属性】
技术研发人员:李文海,魏骁勇,庞磊,陶坤,江佳翼,
申请(专利权)人:武汉大学,鹏城实验室,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。