一种药学数据集成方法及系统技术方案

技术编号：32743491 阅读：12 留言：0更新日期：2022-03-20 08:50

本申请公开了一种药学数据集成方法及系统，该方法包括以下步骤：针对多个药学数据源，分别建立各个药学数据源的数据模型和数据采集器；根据各个药学数据源的数据模型和数据采集器，建立各个药学数据源的采集任务；其中，不同的药学数据源的采集任务相互独立；基于各个药学数据源的采集任务，生成各个药学数据源的采集数据，并将所述采集数据同步到采集数据库；对所述采集数据进行数据分类和预处理，将得到的缓存数据导入到数据缓存库；对所述缓存数据进行标准化，将得到的标准化数据导入到药学关系数据库；将所述标准化数据转换为标准化图格式数据，将所述标准化图格式数据导入到药学图数据库，并基于所述药学图数据库构建药学知识库。知识库。知识库。

全部详细技术资料下载

【技术实现步骤摘要】
一种药学数据集成方法及系统

[0001]本申请属于计算机
，具体涉及一种药学数据集成方法及系统。

技术介绍

[0002]随着生命科学领域的数据飞速增长，同时新的技术突破进一步促进了药物设计、药物筛选、临床试验等药物研发和产生，与人类健康密切相关的生命医学领域的数据已经达到了惊人的地步。药学是由多个学科相互交叉、互相渗透构成的一门庞大的科学体系，与数理化、生命科学、药物专业、临床医学、文献学等学科紧密相连。研究人员、临床医生和医疗机构如何有效地获取、分类、存储和分析药学及相关信息，发现蕴藏其中的有用知识，对揭示人体奥秘、提高人类健康水平有着十分重要的科学价值和现实意义。
[0003]来自生物、医药、医械、试验与健康管理等各方面的数据共同构成了生物
‑
医学
‑
药学大数据。药学数据有如下特点：(1)原始数据量大、离散性强、异构数据多。(2)难以用数学方式表达其结构及特征，且难以标准化，例如：药物的药理药效描述、药物溶出度曲线、医学文献等非结构化数据。(3)数据包含大量冗余的、无意义的或不一致的属性。(4)数据获取困难，常有噪声干扰，且数据更新频繁。由于药学数据具有以上特点，所以多来源的药学数据采集、整理、集成、共享和管理都是难点。
[0004]目前医药相关的数据集成系统有一些已经开展的工作，主要在以下几方面：(1)疾病信息监控系统，例如：全球新冠肺炎疫情地图(https://ncov.dxy.cn/ncovh5/view/pneumonia)是新型冠状病毒(SARS...

【技术保护点】

【技术特征摘要】
1.一种药学数据集成方法，其特征在于，包括以下步骤：针对多个药学数据源，分别建立各个药学数据源的数据模型和数据采集器；其中，不同的药学数据源的数据采集器相互独立；根据各个药学数据源的数据模型和数据采集器，建立各个药学数据源的采集任务；其中，不同的药学数据源的采集任务相互独立；基于各个药学数据源的采集任务，生成各个药学数据源的采集数据，并将所述采集数据同步到采集数据库；对所述采集数据进行数据分类和预处理，将得到的缓存数据导入到数据缓存库；对所述缓存数据进行标准化，将得到的标准化数据导入到药学关系数据库；将所述标准化数据转换为标准化图格式数据，将所述标准化图格式数据导入到药学图数据库，并基于所述药学图数据库构建药学知识库。2.根据权利要求1所述的方法，其特征在于，所述针对多个药学数据源，分别建立各个药学数据源的数据模型和数据采集器，具体包括：对各个药学数据源进行分析，筛选出数据内容和重要数据项，借助药学本体模型，对比各个药学数据源的数据结构，建立各个药学数据源的数据模型，为各个药学数据源建立独立的数据采集器。3.根据权利要求1所述的方法，其特征在于，所述根据各个药学数据源的数据模型和数据采集器，建立各个药学数据源的采集任务，具体包括：根据各个药学数据源的数据模型和数据采集器，确定各个药学数据源的数据采集范围、离线采集需求、实时采集需求、数据采集策略、数据更新策略，定制并配置离线采集模块、实时采集模块和异常处理模块，建立独立的采集任务。4.根据权利要求1所述的方法，其特征在于，所述对所述采集数据进行数据分类和预处理，将得到的缓存数据导入到数据缓存库，具体包括：按照药物、药品、疾病、临床试验、生产鉴定、组学数据、靶点、专利和文献的类别，对所述采集数据进行分类，从所述采集数据中确定重要字段作为数据源内数据关联的基础参考数据；对所述采集数据进行清洗和加工，去除重复数据项、特殊字符和处理空值，完成所述采集数据的格式化，将得到的缓存数据导入到数据缓存库，所述数据缓存库为非关系型数据库。5.根据权利要求1所述的方法，其特征在于，所述将所述标准化数据转换为标准化图格式数据，将所述标准化图格式数据导入到药学图数据库，并基于所述药学图数据库构建药学知识库，具体包括：根据关系数据
‑
图数据映射规则，从所述药学关系数据库中抽取出实体数据、关系数据和属性数据，并将实体数据、关系数据和属性数据转换为实体1
‑
实体2
‑
关系
‑
属性格式，生成标准化图格式数据，将所...

【专利技术属性】
技术研发人员：刘圣，毛逸清，宋伟，马斌，蒋文婷，王鹏飞，
申请(专利权)人：北京迈迪培尔信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人