数据核验方法及装置、电子设备、存储介质制造方法及图纸

技术编号:20799094 阅读:25 留言:0更新日期:2019-04-06 12:47
本公开是关于一种数据核验方法及装置、电子设备、存储介质,涉及医疗大数据技术领域,该方法包括:获取测试对象的原始数据并对所述原始数据进行加密存储;通过预设数据库中的标准医学定义形成对所述测试对象的报告表中的测试数据进行解读的解读规则;根据符合预设条件的多个目标对象的原始数据,对所述解读规则进行训练,得到训练好的解读规则;通过所述训练好的解读规则将所述测试对象的所述原始数据对照所述报告表中的测试数据进行核验。本公开可以提高数据核验效率和准确率。

Data Checking Method and Device, Electronic Equipment and Storage Media

The present disclosure relates to a data verification method and device, electronic equipment and storage medium, and relates to the technical field of medical big data. The method includes: acquiring the original data of the test object and encrypting and storing the original data; forming the interpretation rules of the test data in the report form of the test object by presupposing the standard medical definition in the database; According to the original data of a plurality of target objects meeting the preset conditions, the interpretation rules are trained and the trained interpretation rules are obtained. The original data of the test objects are checked against the test data in the report table by the trained interpretation rules. This disclosure can improve the efficiency and accuracy of data verification.

【技术实现步骤摘要】
数据核验方法及装置、电子设备、存储介质
本公开涉及医疗大数据
,具体而言,涉及一种数据核验方法、数据核验装置、电子设备以及计算机可读存储介质。
技术介绍
在药物临床试验的数据管理中,由于临床试验所需要的任何数据造假或者记录错误都会导致试验结果的偏差、缺失或不准确,因此必须要保证数据的准确性和真实性。相关技术中,通过人工来比对CRF(CASEREPORTFORM,报告表格)表格和经过医生签名的所有相关原始病历,并通过多层人工审核的方式对数据进行核验。这种方式中,由于工作人员的工作能力和医学能力本身随着知识结构的不同有波动,因此该方式存在较大的局限性,难以全量量化监测,也导致数据核验的准确率较低。除此之外,还可以通过依赖研究者对原始病历签字包括电子签名并存档、稽查部门基于试验计划进行飞行稽查核对来确定数据的真实性。其中,由于是通过人工核验数据,核验速度较慢,因此使得数据核验效率较低;除此之外,由于可能会出现误操作,导致数据核验准确率较低,从而严重影响药物临床试验进度。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种数据核验方法及装置、电子设备、存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的不能快速准确进行数据核验的问题。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一个方面,提供一种数据核验方法,包括:获取测试对象的原始数据并对所述原始数据进行加密存储;通过预设数据库中的标准医学定义形成对所述测试对象的报告表中的测试数据进行解读的解读规则;根据符合预设条件的多个目标对象的原始数据,对所述解读规则进行训练,得到训练好的解读规则;通过所述训练好的解读规则将所述测试对象的所述原始数据对照所述报告表中的测试数据进行核验。在本公开的一种示例性实施例中,对所述原始数据进行加密存储包括:按照时间线对所述原始数据进行存储,并生成针对所述原始数据的加密码,以通过所述加密码对所述原始数据进行加密。在本公开的一种示例性实施例中,按照时间线对所述原始数据进行存储包括:按照所述时间线包含的每个时间点分别存储一份原始数据,并隔离记录针对每份原始数据的加密码。在本公开的一种示例性实施例中,通过预设数据库中的标准医学定义形成对所述测试对象的报告表中的测试数据进行解读的解读规则包括:将所述报告表中测试数据对应的医学定义关联到所述预设数据库中的标准医学定义,以确定所述测试数据的来源;通过自然语言处理算法提取所述报告表中的测试数据包含的每个字段之间的临床逻辑关联和流行病学关联,以形成字段规则;通过所述测试数据的来源以及所述字段规则生成用于对所述报告表进行解读的所述解读规则。在本公开的一种示例性实施例中,根据符合预设条件的多个目标对象的原始数据,对所述解读规则进行训练,得到训练好的解读规则包括:采用自然语言处理算法结合贝叶斯算法,通过符合所述预设条件的多个目标对象的所述原始数据对所述解读规则进行训练并计算核验准确率,直至所述核验准确率达到预设值为止,以确定所述训练好的解读规则;其中,所述预设条件包括与所述测试对象入组条件相同和/或症状信息相同。在本公开的一种示例性实施例中,通过所述训练好的解读规则将所述测试对象的所述原始数据对照所述报告表中的测试数据进行核验包括:通过所述训练好的解读规则对时间线上包含的每个时间点的所述报告表中的所述测试数据进行解读,并将解读的测试数据以及原始数据进行自动对比,确定所述报告表中的测试数据和所述原始数据是否一致。在本公开的一种示例性实施例中,所述方法还包括:在所述报告表中的测试数据和所述原始数据不一致时,对所述报告表中的测试数据进行标记;在所述原始数据与对应的加密码不一致时,对所述原始数据进行标记。根据本公开的一个方面,提供一种数据核验装置,包括:原始数据获取模块,用于获取测试对象的原始数据并对所述原始数据进行加密存储;规则生成模块,用于通过预设数据库中的标准医学定义提取对所述测试对象的报告表中的测试数据进行解读的解读规则;规则训练模块,用于根据符合预设条件的多个目标对象的所述原始数据,对所述解读规则进行训练,得到训练好的解读规则;核验控制模块,用于通过所述训练好的解读规则将所述测试对象的所述原始数据对照所述报告表中的测试数据进行核验。根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的数据核验方法。根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的数据核验方法。本公开示例性实施例中提供的一种数据核验方法、数据核验装置、电子设备以及计算机可读存储介质中,一方面,通过对解读规则进行训练得到性能更好的训练好的解读规则,并基于训练好的解读规则对报告表中的测试数据进行解读,进而对解读的测试数据对照测试对象的原始数据进行对比核验,提高了数据核验效率并且避免出现误操作,提高数据核验准确率,保证药物临床试验正常进行;另一方面,通过预设数据库中的标准医学定义形成解读规则,避免了由于工作人员本身对知识的局限性,能够实现全量量化监测,进而提高了数据核验的准确率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示意性示出本公开示例性实施例中一种数据核验方法示意图;图2示意性示出本公开示例性实施例中对解读规则进行训练的示意图;图3示意性示出本公开示例性实施例中一种数据核验装置的框图;图4示意性示出本公开示例性实施例中一种电子设备的框图;图5示意性示出本公开示例性实施例中一种程序产品。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络本文档来自技高网...

【技术保护点】
1.一种数据核验方法,其特征在于,包括:获取测试对象的原始数据并对所述原始数据进行加密存储;通过预设数据库中的标准医学定义形成对所述测试对象的报告表中的测试数据进行解读的解读规则;根据符合预设条件的多个目标对象的原始数据,对所述解读规则进行训练,得到训练好的解读规则;通过所述训练好的解读规则将所述测试对象的所述原始数据对照所述报告表中的测试数据进行核验。

【技术特征摘要】
1.一种数据核验方法,其特征在于,包括:获取测试对象的原始数据并对所述原始数据进行加密存储;通过预设数据库中的标准医学定义形成对所述测试对象的报告表中的测试数据进行解读的解读规则;根据符合预设条件的多个目标对象的原始数据,对所述解读规则进行训练,得到训练好的解读规则;通过所述训练好的解读规则将所述测试对象的所述原始数据对照所述报告表中的测试数据进行核验。2.根据权利要求1所述的数据核验方法,其特征在于,对所述原始数据进行加密存储包括:按照时间线对所述原始数据进行存储,并生成针对所述原始数据的加密码,以通过所述加密码对所述原始数据进行加密。3.根据权利要求2所述的数据核验方法,其特征在于,按照时间线对所述原始数据进行存储包括:按照所述时间线包含的每个时间点分别存储一份原始数据,并隔离记录针对每份原始数据的加密码。4.根据权利要求1所述的数据核验方法,其特征在于,通过预设数据库中的标准医学定义形成对所述测试对象的报告表中的测试数据进行解读的解读规则包括:将所述报告表中测试数据对应的医学定义关联到所述预设数据库中的标准医学定义,以确定所述测试数据的来源;通过自然语言处理算法提取所述报告表中的测试数据包含的每个字段之间的临床逻辑关联和流行病学关联,以形成字段规则;通过所述测试数据的来源以及所述字段规则生成用于对所述报告表进行解读的所述解读规则。5.根据权利要求1所述的数据核验方法,其特征在于,根据符合预设条件的多个目标对象的原始数据,对所述解读规则进行训练,得到训练好的解读规则包括:采用自然语言处理算法结合贝叶斯算法,通过符合所述预设条件的多个目标对象的所述原始数据对所述解读规则进行训练并计算核验准确率...

【专利技术属性】
技术研发人员:何直阎昭
申请(专利权)人:金色熊猫有限公司
类型:发明
国别省市:中国香港,81

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1