试验数据的核查方法及装置、存储介质及电子设备制造方法及图纸

技术编号:23558891 阅读:27 留言:0更新日期:2020-03-25 04:19
本公开涉及数据处理技术领域,具体涉及一种试验数据的核查方法、试验数据的核查装置、计算机可读存储介质及电子设备,所述方法包括:对目标试验中各试验对象的试验数据进行预处理生成各所述试验对象对应的顺序向量;对各所述顺序向量进行聚类分析以获取聚类结果;其中,所述聚类结果包括N个聚类簇,N取正整数;根据预设抽样规则在N个所述聚类簇包含的顺序向量中抽取目标样本,以对目标样本对应的所述试验对象的所述试验数据进行核查。本公开实施例的技术方案能够准确表示一个试验对象的试验顺序,并能够在核查准确率可控的前提下,降低人工核查的工作量,提升核查的效率。

Test data verification method and device, storage medium and electronic equipment

【技术实现步骤摘要】
试验数据的核查方法及装置、存储介质及电子设备
本公开涉及数据处理
,具体而言,涉及一种试验数据的核查方法、试验数据的核查装置、计算机可读存储介质及电子设备。
技术介绍
在科技发展迅速的当今社会,各种领域都在不断创新和发展。在医药领域中,也有越来越多的新药被制备出来。为了保证新药的安全性和疗效,当一种新药被制备出来后,往往需要先进行临床实验。在进行临床实验的过程中,会有许多因素影响试验数据的质量。为此,在根据试验数据对新药进行评价之前,需要对试验数据进行核查。目前,在对临床试验的试验数据进行核查时,通常需要先根据临床试验电子数据采集系统(EDC系统)对试验数据中的缺失值、异常值和时间范围进行核查,再通过人工的方式对一个试验对象的试验顺序进行核查。然而,通过人工对试验顺序进行核查的方式需要耗费大量的人力和时间,因此会造成核查效率低下的问题,严重影响新药的评价速度。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的本文档来自技高网...

【技术保护点】
1.一种试验数据的核查方法,其特征在于,包括:/n对目标试验中各试验对象的试验数据进行预处理生成各所述试验对象对应的顺序向量;/n对各所述顺序向量进行聚类分析以获取聚类结果;其中,所述聚类结果包括N个聚类簇,N取正整数;/n根据预设抽样规则在N个所述聚类簇包含的顺序向量中抽取目标样本,以对目标样本对应的所述试验对象的所述试验数据进行核查。/n

【技术特征摘要】
1.一种试验数据的核查方法,其特征在于,包括:
对目标试验中各试验对象的试验数据进行预处理生成各所述试验对象对应的顺序向量;
对各所述顺序向量进行聚类分析以获取聚类结果;其中,所述聚类结果包括N个聚类簇,N取正整数;
根据预设抽样规则在N个所述聚类簇包含的顺序向量中抽取目标样本,以对目标样本对应的所述试验对象的所述试验数据进行核查。


2.根据权利要求1所述的方法,其特征在于,所述预设抽样规则包括预设排序规则;
所述根据预设抽样规则在N个所述聚类簇包含的顺序向量中抽取目标样本,包括:
根据预设排序规则对N个所述聚类簇进行排序以获取聚类簇序列;
根据各所述聚类簇在所述聚类簇序列中的排序在各所述聚类簇中抽取所述顺序向量得到目标样本。


3.根据权利要求2所述的方法,其特征在于,所述预设抽样规则还包括所述预设排序规则对应的抽样率计算方法;
所述根据各所述聚类簇在所述聚类簇序列中的排序在各所述聚类簇中抽取所述顺序向量得到目标样本,包括:
基于各所述聚类簇在所述聚类簇序列中的排序,根据所述抽样率计算方法确定各所述聚类簇对应的抽样率;
根据所述抽样率在对应的所述聚类簇中抽取所述顺序向量得到目标样本。


4.根据权利要求3所述的方法,其特征在于,所述抽样率计算方法,包括:
获取目标聚类簇在所述聚类簇序列中的排位n;其中n取正整数;
计算n-1与N的比值并确定为所述目标聚类簇的抽样率。


5.根据权利要求2所述的方法,其特征在于,所述预设排序规则包括根据相似度从大到小排序;
所述根据预设排序规则对N个所述聚类簇进行排序以获取聚类簇序列,包括:
以N个所述聚类簇中包含顺序向量数量最多的聚类簇为基准簇,计算剩余N-1个所述聚类簇与所述基准簇的相似度;
以所述基准簇为第一位,根据所述相似度从大到小的顺...

【专利技术属性】
技术研发人员:王军涛
申请(专利权)人:天津开心生活科技有限公司天津新开心生活科技有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1