计算机实现的方法和系统技术方案

技术编号:26847648 阅读:23 留言:0更新日期:2020-12-25 13:12
本发明专利技术涉及计算机实现的方法和系统。本说明书中所描述的主题的方面体现在如下的系统和方法中,该系统和方法利用机器学习技术以使用被训练为识别表示与临床试验调查相关联的不良事件的异常的一个或多个学习模型来评价临床试验数据。在一些实现中,获得在临床试验场所收集到的调查数据。选择与临床试验场所相对应的模型集。模型集中所包括的各模型被训练为基于在临床试验场所收集到的历史调查数据来识别用于指示与调查数据相关联的依从性风险的一个或多个指标的不同的集合。基于调查数据相对于历史调查数据来确定临床试验场所的评分。评分表示调查数据与表示依从性风险的至少一个指标相关联的可能性。

【技术实现步骤摘要】
计算机实现的方法和系统
本说明书涉及用于进行数据分析、更具体地涉及用于进行预测分析的技术。
技术介绍
数据聚合可以包括编译来自多个不同源的数据。根据正编译的数据所来自的源的特性,可能存在处理数据以识别数据模式的挑战。例如,从异构数据源获得的数据可以是不同的不兼容格式,这需要显著的处理能力来生成用于产生纵向映射(longitudinalmapping)的索引。此外,可能存在限制对来自某些提供方的数据的访问的约束或其它因素。一旦从多个不同的异构源获得数据,就可能很难在用户界面中有效地呈现该数据,特别是在所获得的数据将基于各用户而不同的情况下。
技术实现思路
一般来说,本说明书中所描述的主题的创新方面可以体现在如下的系统和方法中,该系统和方法利用机器学习技术,通过应用被训练为识别表示与临床试验调查相关联的不良事件的异常的一个或多个学习模型来处理和评价临床试验数据。例如,在一些实例中,系统应用学习模型以检测参加临床试验的患者的医疗记录中所存在的数据异常。在其它实例中,系统应用学习模型以确定由于对与疾病状况的处置相关联的不良事件的低估(underreporting)、延迟报告或缺少报告而导致的、与临床试验相关联的依从性风险的可能性。在一个一般方面中,本说明书中所描述的主题可以体现在如下的方法中,该方法包括以下的操作:获得在临床试验场所收集到的调查数据;选择与所述临床试验场所相对应的模型集,其中,所述模型集中所包括的各模型被训练为基于在所述临床试验场所收集到的历史调查数据来识别用于指示与所述调查数据相关联的依从性风险的一个或多个指标的不同的集合;使用所述模型集,基于所述调查数据相对于所述历史调查数据来确定所述临床试验场所的评分,其中,所述评分表示所述调查数据与表示所述依从性风险的至少一个指标相关联的可能性;以及基于所述临床试验场所的评分来向所述临床试验场所提供所述依从性风险的指示。这些和其它版本可以各自可选地包括以下特征中的一个或多个。例如,在一些实现中,所述依从性风险与由所述模型集识别为表示与所述调查数据相关联的监管机构所指定的不良事件的数据记录的子集相关联。在一些实现中,所述依从性风险指示所述数据记录的子集中所包括的所有数据记录尚未被报告给所述监管机构。在一些实现中,所述依从性风险指示所述数据记录的子集中所包括的一个或多个数据记录尚未被报告给所述监管机构。在一些实现中,所述依从性风险指示所述数据记录的子集可能在超过用于报告所述不良事件的阈值时间段的时间段内被报告给所述监管机构。在一些实现中,用于报告所述不良事件的阈值时间段由(i)发现所述不良事件的第一时间点、以及(ii)所述不良事件被报告给所述监管机构的第二时间点来定义。在一些实现中,所述模型集包括:第一模型,其被训练为识别表示所述依从性风险的一个或多个指标的第一集合;以及第二模型,其被训练为识别表示所述依从性风险的一个或多个指标的第二集合。在这样的实现中,确定所述临床试验场所的评分包括以下的操作:基于相对于所述一个或多个指标的第一集合处理所述调查数据,来确定所述调查数据的第一子评分;基于相对于所述一个或多个指标的第二集合处理所述调查数据,来确定所述调查数据的第二子评分;以及组合所述第一子评分和所述第二子评分以确定所述临床试验场所的评分。在一些实现中,所述方法还包括以下的操作:判断为所述第一模型所提供的输出与所述第二模型所提供的输出相比可能具有更高的准确率。另外,基于判断为所述第一模型所提供的输出与所述第二模型所提供的输出相比可能具有更高的准确率,所述方法还包括:向所述第一子评分分配第一权重;以及向所述第二子评分分配第二权重,其中,所述第一权重的值超过所述第二权重的值。在这样的实现中,组合所述第一子评分和所述第二子评分以确定所述临床试验场所的评分包括:基于被分配给所述第一子评分的第一权重和被分配给所述第二子评分的第二权重来组合所述第一子评分和所述第二子评分。在一些实现中,所述方法还包括以下的操作:判断为所述评分满足阈值;以及基于判断为所述评分满足阈值而判断为所述临床试验场所是风险相关临床场所。在一些实现中,阈值的值由访问调查数据的用户指定。在一些实现中,选择与所述临床试验场所相对应的模型集包括以下的操作:确定与所述临床试验场所相关联的一个或多个属性;识别模型集,所述模型集中的各模型被训练为处理表示所述一个或多个属性的数据;针对所述模型集中所包括的各模型,计算反映通过模型所生成的预测与所述调查数据相关的可能性的相关度评分;以及从所述模型集中选择被确定为具有满足阈值的相关度评分的模型子集。在另一一般方面中,本说明书中所描述的主体可以体现在如下的方法中,该方法包括以下的操作:从一个或多个数据库获得临床试验的医疗记录;识别与所述医疗记录相关联的一个或多个查找参数;基于所述一个或多个查找参数来选择用于评价所述医疗记录的指标集,其中,所述指标集中所包括的各指标指定表示所述临床试验的医疗记录中所包括的医疗记录的可能异常的不同条件;从所述医疗记录中确定医疗记录的子集,其中,所述医疗记录的子集由如下的模型辨识,该模型被训练为识别满足所述指标集所指定的条件中至少之一的医疗记录;使用所述模型来确定所述医疗记录的子集中所包括的各医疗记录的评分;以及提供指示所述评分的数据以供输出。这些和其它版本可以各自可选地包括以下特征中的一个或多个。例如,在一些实现中,针对所述医疗记录的子集确定的评分体现的是,所述医疗记录的子集中所包括的医疗记录表示与所述临床试验相关联的不良事件的相应可能性。在一些实现中,所述一个或多个查找参数包括指示与所述临床试验相关联的药物的查找参数。在一些实现中,所述指标集包括指定所述药物的预期剂量的指标。在一些实现中,所述医疗记录的子集包括与由所述模型识别为正被开具超过所述药物的预期剂量的药物剂量的患者相关联的医疗记录。在一些实现中,所述一个或多个查找参数包括指示与所述临床试验相关联的疾病状况的查找参数。在一些实现中,所述指标集包括指定针对所述疾病状况的预期处置计划的指标。在一些实现中,所述医疗记录的子集包括与由所述模型识别为正偏离针对所述疾病状况的预期处置计划的处置事件相关联的医疗记录。其它版本包括被配置为进行编码在计算机存储装置上的方法的动作的相应系统、设备和计算机程序。本说明书中所描述的主题的一个或多个实现的细节在以下的附图部分和具体实施方式部分中阐述。根据具体实施方式部分、附图部分和权利要求书部分可以明显看出本主题的其它潜在特征、方面和优点。附图说明图1示出针对从多个异构数据源获得的数据计算优化数据预测的系统的示例。图2示出图1中所描绘的系统可以应用的数据处理技术的示例。图3A~C示出用于检测与临床试验相关联的电子医疗记录中的异常的技术的示例。图4A~D示出用于预测由于与不良事件相关联的可能性而导致的与临床试验相关联的依从性风险的技术的示例。图5是可以实现本文所述的处理或本文档来自技高网...

【技术保护点】
1.一种计算机实现的方法,包括:/n获得在临床试验场所收集到的调查数据;/n选择与所述临床试验场所相对应的模型集,/n其中,所述模型集中所包括的各模型被训练为基于在所述临床试验场所收集到的历史调查数据来识别用于指示与所述调查数据相关联的依从性风险的一个或多个指标的不同的集合;/n使用所述模型集,基于针对所述一个或多个指标的集合的子评分来确定所述临床试验场所的评分,其中,所述子评分是基于所述调查数据相对于所述历史调查数据而确定的,/n其中,所述评分表示所述调查数据与表示所述依从性风险的至少一个指标相关联的可能性;以及/n基于所述临床试验场所的评分来向所述临床试验场所提供所述依从性风险的指示。/n

【技术特征摘要】
20190625 US 16/451,0971.一种计算机实现的方法,包括:
获得在临床试验场所收集到的调查数据;
选择与所述临床试验场所相对应的模型集,
其中,所述模型集中所包括的各模型被训练为基于在所述临床试验场所收集到的历史调查数据来识别用于指示与所述调查数据相关联的依从性风险的一个或多个指标的不同的集合;
使用所述模型集,基于针对所述一个或多个指标的集合的子评分来确定所述临床试验场所的评分,其中,所述子评分是基于所述调查数据相对于所述历史调查数据而确定的,
其中,所述评分表示所述调查数据与表示所述依从性风险的至少一个指标相关联的可能性;以及
基于所述临床试验场所的评分来向所述临床试验场所提供所述依从性风险的指示。


2.根据权利要求1所述的方法,其中,所述依从性风险与由所述模型集识别为表示与所述调查数据相关联的监管机构所指定的不良事件的数据记录的子集相关联。


3.根据权利要求2所述的方法,其中,所述依从性风险指示所述数据记录的子集中所包括的所有数据记录尚未被报告给所述监管机构。


4.根据权利要求2所述的方法,其中,所述依从性风险指示所述数据记录的子集中所包括的一个或多个数据记录尚未被报告给所述监管机构。


5.根据权利要求2所述的方法,其中,
所述依从性风险指示所述数据记录的子集可能在超过用于报告所述不良事件的阈值时间段的时间段内被报告给所述监管机构。


6.根据权利要求5所述的方法,其中,用于报告所述不良事件的阈值时间段由(i)发现所述不良事件的第一时间点、以及(ii)所述不良事件被报告给所述监管机构的第二时间点来定义。


7.根据权利要求1所述的方法,其中,
所述模型集包括:
第一模型,其被训练为识别表示所述依从性风险的一个或多个指标的第一集合;以及
第二模型,其被训练为识别表示所述依从性风险的一个或多个指标的第二集合;以及
确定所述临床试验场所的评分包括:
基于相对于所述一个或多个指标的第一集合处理所述调查数据,来确定所述调查数据的第一子评分;
基于相对于所述一个或多个指标的第二集合处理所述调查数据,来确定所述调查数据的第二子评分;以及
组合所述第一子评分和所述第二子评分以确定所述临床试验场所的评分。


8.根据权利要求7所述的方法,还包括:
判断为所述第一模型所提供的输出与所述第二模型所提供的输出相比可能具有更高的准确率;以及
基于判断为所述第一模型所提供的输出与所述第二模型所提供的输出相比可能具有更高的准确率:
向所述第一子评分分配第一权重,以及
向所述第二子评分分配第二权重,其中,所述第一权重的值超过所述第二权重的值;以及
其中,组合所述第一子评分和所述第二子评分以确定所述临床试验场所的评分包括:基于被分配给所述第一子评分的第一权重和被分配给所述第二子评分的第二权重来组合所述第一子评分和所述第二子评分。


9.根据权利要求2所述的方法,还包括:
判断为所述评分满足阈值;以及
基于判断为所述评分满足阈值而判断为所述临床试验场所是风险相关临床场所。

【专利技术属性】
技术研发人员:V·博纳格里R·帕蒂尔N·塔那维鲁黄建V·P·艾
申请(专利权)人:IQVIA有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1