医保风控数据采集方法及装置制造方法及图纸

技术编号:37530931 阅读:15 留言:0更新日期:2023-05-12 15:57
本发明专利技术公开了一种医保风控数据采集方法及装置。其中医保风控数据采集方法包括:对预先获得的至少一个原始医疗数据表中各列进行内容特征提取;将各列的内容特征,与预设的视图信息表的权重配置信息进行匹配,确定原始医疗数据表中匹配的内容特征所对应的权重值;根据匹配的内容特征所对应的权重值,计算各原始医疗数据表与每个待生成的目标视图信息表的相关度值;按照与视图信息表对应的相关度值的高低,将原始医疗数据表与所述目标视图信息表进行关联展示。方便业务人员根据所展示的原始医疗数据表,从中选取有用的信息以构建目标视图信息表,极大地提高了构建信息视图的效率,为相关的后续业务操作提供数据来源。为相关的后续业务操作提供数据来源。为相关的后续业务操作提供数据来源。

【技术实现步骤摘要】
医保风控数据采集方法及装置


[0001]本专利技术涉及医保风控
,特别涉及一种医保风控数据采集方法及装置。

技术介绍

[0002]现代化医院基本均采用医院信息系统(Hospital Information System,HIS)对门诊、住院患者的就医信息进行存储和管理。但目前不同医院使用的HIS系统的厂商不一致,导致不同医院的HIS系统中的表格的数据格式及表格信息杂乱,有相当一部分表格的表头和表名的可读性很低,无法理解其含义。
[0003]对于需要从HIS系统中的数据进行后续分析的业务场景,例如,基于原始医疗数据表,进行医保风控数据采集的场景而言,需要从不同HIS系统的原始数据表格中,抽取其中所需的信息来构建信息视图,如生成视图信息表,用作后续的数据分析和异常情况的检测。
[0004]但由于前述原因,目前不同医院HIS系统的原始医疗数据表的识读性较差,且原始医疗数据表的数量庞大、数据内容杂乱缺乏统一的数据标准,对构建信息视图而言造成了不少的困难,缺少一种高效的构建信息视图的辅助手段。

技术实现思路

[0005]鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种医保风控数据采集方法及装置。
[0006]第一方面,本专利技术实施例提供一种医保风控数据采集方法,包括:对预先获得的至少一个原始医疗数据表中各列进行内容特征提取;将各列的所述内容特征,与预设的视图信息表的权重配置信息进行匹配,确定所述原始医疗数据表中匹配的内容特征所对应的权重值;所述视图信息表是根据所述原始医疗数据表抽取所需信息得到的表格;根据匹配的内容特征所对应的权重值,计算各所述原始医疗数据表与每个待生成的目标视图信息表的相关度值;按照与所述视图信息表对应的所述相关度值的高低,将原始医疗数据表与所述目标视图信息表进行关联展示。
[0007]在一个实施例中,所述对预先获得的至少一个原始医疗数据表中各列进行内容特征提取,包括:利用预设的特征提取模型,对预先获得的至少一个原始医疗数据表的各单元格数据进行特征提取,得到特征向量;将所述特征向量,输入至预先训练得到的医疗数据分类模型,获得各所述单元格数据对应的模型分类标签;根据所述模型分类标签,统计确定所述原始医疗数据表中各列对应的内容特征。
[0008]在一个实施例中,所述根据所述模型分类标签,统计确定所述原始医疗数据表中各列对应的内容特征,包括:
确定所述原始医疗数据表中每个列的所有单元格数据的模型分类标签中出现次数最多的模型分类标签,作为众数标签;将所述众数标签作为所述列对应的列分类标签;将每个原始医疗数据表中所有列的全部所述列分类标签作为每个原始医疗数据表的内容特征。
[0009]在一个实施例中,在所述将所述众数标签作为所述列对应的列分类标签之前,还包括:判断所述众数标签在列内的数量占比是否超过阈值;若是,执行所述将所述众数标签作为所述列对应的列分类标签的步骤;若否,将预设的默认标签作为所述列对应的列分类标签。
[0010]在一个实施例中,所述视图信息表的权重配置信息中包含:每个视图信息表所包含的各个医疗数据类型及对应的权重值;所述将每个原始医疗数据表各列的内容特征,与预设的视图信息表的权重配置信息进行匹配,确定原始医疗数据表中匹配的内容特征所对应的权重值,包括:将每个原始医疗数据表的内容特征,与所述权重配置信息中每个视图信息表的各个医疗数据类型进行匹配;在任一个原始医疗数据表的内容特征与任一个视图信息表包含的医疗数据类型部分匹配或者完全匹配的情况下,将医疗数据类型的权重值确定为与所述医疗数据类型相匹配的内容特征的权重值。
[0011]在一个实施例中,根据匹配的内容特征所对应的权重值,计算每个原始医疗数据表与每个待生成的目标视图信息表的相关度值,包括:针对每个原始医疗数据表和每个所述目标视图信息表,对与所述目标视图信息表的医疗数据类型相匹配的原始医疗数据表内容特征的权重值进行计算,得到所述原始医疗数据表与所述目标视图信息表的相关度值;所述计算包括:求平均值、求和值或求加权平均值。
[0012]在一个实施例中,所述医疗数据分类模型,通过下述方式预先训练得到:确定预先生成的视图信息表中的单元格数据对应的模型分类标签;利用预设的特征提取模型,对预先已生成的视图信息表中的单元格数据进行特征向量的提取,获得与所述每个单元格数据对应的特征向量数据;根据所述每个单元格数据对应的特征向量数据和所述模型分类标签,生成样本数据;使用所述样本数据,对预设的分类器模型进行训练,得到医疗数据分类模型。
[0013]第二方面,本专利技术实施例提供一种医保风控数据采集装置,包括:提取模块,用于对预先获得的至少一个原始医疗数据表中各列进行内容特征提取;权重值确定模块,用于将各列的所述内容特征,与预设的视图信息表的权重配置信息进行匹配,确定所述原始医疗数据表中匹配的内容特征所对应的权重值;计算模块,用于根据匹配的内容特征所对应的权重值,计算各所述原始医疗数据表与每个待生成的目标视图信息表的相关度值;
数据展示模块,用于按照与所述视图信息表对应的所述相关度值的高低,将原始医疗数据表与所述目标视图信息表进行关联展示。
[0014]第三方面,本专利技术实施例提供一种服务器,包括:存储器、处理器及存储于存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如前述的医保风控数据采集方法。
[0015]第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如前述的医保风控数据采集方法。
[0016]本专利技术实施例提供的上述技术方案的有益效果至少包括:本专利技术实施例提供的医保风控数据采集方法及装置,对原始医疗数据表的内容特征的提取,并通过预设的视图信息表的权重配置信息,可准确地识别出原始医疗数据表与待生成的视图信息表之间的匹配程度,并按匹配程度高低,将原始医疗数据表与待生成的视图信息表进行关联展示,方便业务人员根据所展示的原始医疗数据表,从中选取有用的信息以构建目标视图信息表,极大地提高了构建信息视图的效率,为相关的后续业务操作提供数据来源。
[0017]本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
[0018]下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。
附图说明
[0019]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1为本专利技术实施例中医保风控数据采集方法的流程图;图2为本专利技术实施例中对预先获得的至少一个原始医疗数据表中各列进行内容特征提取的流程图;图3为本专利技术实施例中原始医疗数据表的示意图;图4为本专利技术实施例中门诊急诊处方信息表的模型分类标签的预测结果示意图;图5本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医保风控数据采集方法,其特征在于,包括:对预先获得的至少一个原始医疗数据表中各列进行内容特征提取;将各列的所述内容特征,与预设的视图信息表的权重配置信息进行匹配,确定所述原始医疗数据表中匹配的内容特征所对应的权重值;所述视图信息表是根据所述原始医疗数据表抽取所需信息得到的表格;根据匹配的内容特征所对应的权重值,计算各所述原始医疗数据表与每个待生成的目标视图信息表的相关度值;按照与所述目标视图信息表对应的所述相关度值的高低,将原始医疗数据表与所述目标视图信息表进行关联展示。2.如权利要求1所述的方法,其特征在于,所述对预先获得的至少一个原始医疗数据表中各列进行内容特征提取,包括:利用预设的特征提取模型,对预先获得的至少一个原始医疗数据表的各单元格数据进行特征提取,得到特征向量;将所述特征向量,输入至预先训练得到的医疗数据分类模型,获得各所述单元格数据对应的模型分类标签;根据所述模型分类标签,统计确定所述原始医疗数据表中各列对应的内容特征。3.如权利要求2所述的方法,其特征在于,所述根据所述模型分类标签,统计确定所述原始医疗数据表中各列对应的内容特征,包括:确定所述原始医疗数据表中每个列的所有单元格数据的模型分类标签中出现次数最多的模型分类标签,作为众数标签;将所述众数标签作为所述列对应的列分类标签;将每个原始医疗数据表中所有列的全部所述列分类标签作为每个原始医疗数据表的内容特征。4.如权利要求3所述的方法,其特征在于,在所述将所述众数标签作为所述列对应的列分类标签之前,还包括:判断所述众数标签在列内的数量占比是否超过阈值;若是,执行所述将所述众数标签作为所述列对应的列分类标签的步骤;若否,将预设的默认标签作为所述列对应的列分类标签。5.如权利要求1所述的方法,其特征在于,所述视图信息表的权重配置信息中包含:每个视图信息表所包含的各个医疗数据类型及对应的权重值;所述将每个原始医疗数据表各列的内容特征,与预设的视图信息表的权重配置信息进行匹配,确定原始医疗数据表中匹配的内容特征所对应的权重值,包括:将每个原始医疗数据表的内容特征,与所述权重配置信息中每个视图信息表的各个医疗数据类型进行匹配;在任一个原始医疗数据表的内容特征与任一个视...

【专利技术属性】
技术研发人员:沈丹婷张灏赵礼悦齐综擎
申请(专利权)人:北京亚信数据有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1