基于从较小数据集计算出的值估计从大数据集得出的值的方法和系统技术方案

技术编号:13490490 阅读:62 留言:0更新日期:2016-08-07 00:37
本文档针对当大数据集可用时,从可用的较小数据集计算出的值估计可能从大数据集得出的值的方法和系统。当前描述的方法和系统的具体例子是从假想的数据集估计各种医疗记录相关的统计和值的方法和系统。为了从观察到的较小数据集外推期望的统计和计算值,多个模型被当前公开的方法和系统采用。这些模型可以按顺序被采用,以通过各种多维度数据集体量生成相对细粒度的估计。

【技术实现步骤摘要】
【国外来华专利技术】对相关申请的交叉引用本申请要求于2013年12月17日提交的临时申请No.61/916,909的权益。
本文档针对用于当大数据集可用时,从可用的较小数据集计算出的值估计可能从大数据集得到的值的方法和系统,并且在具体的例子中,针对基于较小的医疗索赔相关的数据集,为大的、假想的医疗索赔相关的数据集估计汇总计算结果的方法和系统。
技术介绍
医疗索赔的处理是由包括保险公司、索赔处理机构、索赔付款人机构、各种类型的医疗服务提供者以及患者的许多不同实体合作执行的大且复杂的努力。每年在美国处理体量(volume)巨大的医疗索赔。在索赔处理中涉及的各种实体,包括索赔处理机构,通常希望监视和跟踪在全国范围内由各种患者段生成的索赔类型和索赔体量的趋势,以便预测对增加的索赔处理能力和基础设施的需要、在服务不足领域的市场服务、促进流行病学的研究和其它类型的医学研究、用于计划员工雇用和福利、以及用于许多其它原因。但是,当前在医疗索赔处理中涉及的各种机构只可以直接观察到在特定时间段在某个地理区域内发生的医疗索赔事务的总体量的小的子体量。因此,这些机构继续寻求将允许只基于由机构观察到的医疗索赔事务的子集精确估计医疗索赔相关的统计以及其它计算值的系统和方法。
技术实现思路
本文档针对用于当大数据集可用时,根据从可用的较小数据集计算出的值估计可能从大数据集得到的值的方法和系统。当前描述的方法和系统的具体例子是估计从假想的数据集计算出的各种医疗记录相关的统计和值的方法和系统,包括对于各种患者段每单位时间量每患者的索赔数量和对于各种患者段每单位时间量每患者的特定类型索赔的数量。通常,即使只能直接观察到理论数据集的较小子集的数据,也期望估计用于整个国家范围或者国家内的大的地理区域。为了从观察到的较小数据集外推期望的统计和计算值,多个模型被当前公开的方法和系统采用。这些模型可以按顺序被采用,以通过各种多维度数据集体量(multi-dimensionaldata-setvolume)生成相对细粒度的估计。附图说明图1示出了医疗索赔处理环境。图2示出了医疗索赔相关的估计问题领域。图3A-G示出了将使简单缩放统计和计算值受挫的一些现象,这种简单缩放统计(scalingofstatistics)和计算值是基于由特定医疗索赔处理机构观察到的医疗索赔事务,以便估计用于大地理区域或用于特定患者段内的大部分患者的统计和计算值。图4示出由特定索赔处理者处理的医疗索赔的子集。图5示出了在诸如一年的单位时间段提交索赔的所有患者集合,并且该集合的各种子集与特定的索赔处理机构相关。图6A-B示出了一个相对于每患者统计的索赔观察到的现象。图7示出了第二个相对于每患者统计的索赔观察到的现象。图8示出了在第一估计模型下层的状态转换模型。图9示出了其中参数a的值相对于垂直轴绘制并且f的值相对于水平轴绘制的用于大量模拟的示例结果集合。图10示出了多维度每患者索赔体量。图11提供了用于各种类型的计算机的一般体系架构示图。具体实施方式图1示出了医疗索赔处理环境。如在图1中所示,患者从医疗服务提供者接收医疗服务,其中每个患者由小圆盘表示,诸如圆盘102,医疗服务提供者由较大的圆盘表示,诸如圆盘104。服务提供关系由从患者102到医疗服务提供者104的有向边或箭头106表示。如在图1中所示,特定患者,诸如患者108,可以从多个医疗服务提供者接收医疗服务,如由箭头110-112所示。医疗服务提供者向医疗索赔付款人机构提交用于补偿提供给患者的服务的索赔。索赔的提交也在图1中通过箭头表示,诸如箭头114,其表示由医疗服务提供者104向医疗索赔付款人机构116提交医疗索赔。医疗索赔付款人机构又将索赔提交到索赔处理机构,诸如索赔处理机构118。在图1中,诸如箭头120的箭头表示由医疗索赔付款人机构向索赔处理机构提交索赔。索赔处理机构又将索赔提交到保险公司,如由从索赔处理机构发出的箭头所指示的,诸如从索赔处理机构118发出的箭头122-124。作为由当前描述的方法和系统解决的问题领域的一个例子,索赔处理机构可能希望推断平均上为特定段的普通患者—诸如年龄在21和40岁之间、生活在美国大都市区的成年人—提交的各种统计和假设的计算值,诸如索赔的数量。通常,他们希望基于其中它们直接参与的医疗索赔事务估计这些参数和统计。但是,其中特定机构参与的医疗索赔事务可能是在时间单位段内针对感兴趣的患者段执行的医疗索赔事务的总数中相对小的子集。此外,从小数据集计算出的统计和值会由于特定机构对全部医疗索赔有关事务的非均匀采样的影响而显著地偏斜和偏差。图2示出了医疗索赔相关的估计问题领域。如由围绕索赔处理机构204的虚线框202所示,索赔处理机构204会希望估计将从完整的医疗索赔数据集计算出的各种类型的全国范围的医疗索赔相关的统计和值,但是只直接观察那些由医疗索赔付款人机构116和206转发给索赔处理机构的医疗索赔。这些医疗索赔付款人机构又接收仅来自全部数量的医疗服务提供者和患者中的子集的索赔。第一印象,可能会假定特定的索赔处理机构将只需要准确估计由特定索赔处理机构处理的患者的部分以及由特定索赔处理机构处理的索赔的部分,以便能够缩放从由特定索赔处理机构观察到的医疗索赔事务计算出的统计和值,从而为大得多的医疗索赔事务集精确地估计对应的统计和计算值,包括在一年的时间段期间在国家内或国家的大区域内执行的全部医疗索赔事务。但是,情况并非如此。存在许多不同类型的现象使得这种简单的估算方法不准确和不充分。图3A-F示出了将使基于由特定医疗索赔处理机构观察到的医疗索赔事务简单缩放统计和计算值,以便估计用于大地理区域或用于特定患者段内的大部分患者的统计和计算值受挫的一些现象。图3A-F使用如在图1和2中使用的相同的图示约定。此外,用字母“t”标记的有向箭头指示时间的流逝。在图3A中,多个患者301-306从医疗服务提供者307接受医疗服务。医疗提供者307通过付款人机构308向索赔处理机构309提交索赔。但是,在流逝一定时间310之后,患者302不再从医疗服务提供者307接收服务,如由小虚线圆圈311所指示的,并且最初没有从医疗服务提供者307接收医疗服务的两个新患者312和313现在开始从医疗服务提供者307接收医疗服务。作为结果,如果索赔提供机构309试图在包括由箭头310表示本文档来自技高网...

【技术保护点】
一种结合到自动化系统中的方法,用于当大数据集可用时,根据从较小数据集计算出的每提交实体数字值为大数据集估计每提交实体数字值,其中大数据集包括由多个提交实体提交到多个自动化数据‑实体处理系统的多个数据实体,并且较小数据集包括由多个提交实体提交到单个自动化数据‑实体处理系统的多个数据实体,所述方法在包括一个或多个处理器、一个或多个存储器以及一个或多个大容量存储设备的计算机系统中执行,所述方法包括:从较小数据集计算每提交实体数字值;对于提交实体在自动化数据‑实体处理系统之间的迁移,利用第一估计模型校正计算出的每提交实体数字值,以产生校正后的每提交实体数字值;及对于由提交实体到自动化数据‑实体处理系统的非专门性提交,利用第二估计模型校正校正后的每提交实体数字值,以产生当大数据集可用时将从该大数据集中得出的每提交实体数字值的估计。

【技术特征摘要】
【国外来华专利技术】2013.12.17 US 61/916,9091.一种结合到自动化系统中的方法,用于当大数据集可用时,
根据从较小数据集计算出的每提交实体数字值为大数据集估计每提交
实体数字值,其中大数据集包括由多个提交实体提交到多个自动化数
据-实体处理系统的多个数据实体,并且较小数据集包括由多个提交
实体提交到单个自动化数据-实体处理系统的多个数据实体,所述方
法在包括一个或多个处理器、一个或多个存储器以及一个或多个大容
量存储设备的计算机系统中执行,所述方法包括:
从较小数据集计算每提交实体数字值;
对于提交实体在自动化数据-实体处理系统之间的迁移,利用第
一估计模型校正计算出的每提交实体数字值,以产生校正后的每提交
实体数字值;及
对于由提...

【专利技术属性】
技术研发人员:G·古普塔W·科恩R·佩尼A·桑克拉M·桑达吾D·泰百
申请(专利权)人:阿提乔有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1