一种医保反欺诈串换编码挖掘系统及方法技术方案

技术编号:22689894 阅读:68 留言:0更新日期:2019-11-30 04:08
本发明专利技术公开了一种医保反欺诈串换编码挖掘系统及方法,作用于第一字符型目录和第二字符型目录,系统包括依次连接的数据输入模块、数据清理模块、差异度分数模型模块和挖掘串换编码模块,方法包括:S1.清理结算明细数据中的第一字符型目录和第二字符型目录,形成新的第一字符型目录和第二字符型目录;S2.建立第一字符型目录和第二字符型目录之间的差异度分数模型;S3.挖掘串换医疗项目编码情形。医保结算信息明细数据量非常大,导致在分析是否存在串换编码情形时,很难进行高效准确的分析,本发明专利技术挖掘串换医疗收费项目编码方法和系统有效地解决了这一问题,目前本系统和方法已经使用在了医保反欺诈提质增效项目中。

A mining system and method of anti fraud and exchange code for medical insurance

The invention discloses a medical insurance anti fraud serial coding mining system and method, which is applied to the first character catalog and the second character catalog. The system includes successively connected data input module, data cleaning module, difference score model module and mining serial coding module. The method includes: S1. Clearing the first character catalog and the second character catalog in the settlement details data Second, establish the difference score model between the first character and the second character directory; third, mining the serial medical project coding. The amount of detailed data of medical insurance settlement information is very large, which makes it difficult to carry out efficient and accurate analysis when analyzing whether there is serial coding. The method and system of mining serial medical charging item coding of the invention effectively solve this problem. At present, the system and method have been used in the anti fraud, quality improvement and efficiency improvement project of medical insurance.

【技术实现步骤摘要】
一种医保反欺诈串换编码挖掘系统及方法
本专利技术属于数据处理分析
,尤其涉及一种医保反欺诈串换编码挖掘系统及方法。
技术介绍
国家医保局于2019年发布《关于8起欺诈骗取医保基金典型案例的通报》,通报了多起涉及通过串换医疗收费项目等方式骗取医保基金的案例。定点医疗机构、定点零售药店和参保人员等通过串换药品、器械、诊疗项目的手段,多记医保项目费用,已成为恶意骗取医保基金的主要手段之一。在医保结算系统数据库中,每一条就诊结算明细记录都会带有“医院收费项目名称”和对应的“医保三大目录名称”这两个字段。“医院收费项目名称”是各家医疗服务机构内部用来记录病人就诊所使用的医疗收费项目。“医保三大目录名称”包括了基本医疗保险药品目录、诊疗项目目录、医疗服务设施标准,是国家为保证基本医疗保险制度的健康运行所制定的,其中,甲类、乙类医疗收费项目是直接纳入可报销范围或部分纳入可报销范围的。在审核医保基金运用是否规范时,医保结算明细记录的数据量往往非常大,导致难以分析医保三大目录名称和医院收费项目名称是否有串换情形。现有挖掘串换医疗收费项目编码方法能够将医保结算明细数据进行数据挖掘,这是国内第一个针对识别串换医保收费项目的数据分析方法和系统,并且得到了典型的串换甲类、乙类医疗收费项目编码情形。但由于各地数据质量不一,对于一些数据质量较差的地区的非标准的却常见的串换医疗项目编码情形,还需要进行人工处理,医学审核后确定,不断扩大串换案例范围。CN107145587A公开了一种基于大数据挖掘的医保反欺诈系统,它包括以下子系统:数据抽取、转换、加载子系统、大数据存储子系统、数据挖掘子系统、规则库和知识库子系统、实时流计算子系统和可视化子系统,所述数据抽取、转换、加载子系统与大数据存储子系统连接,大数据存储子系统与数据挖掘子系统连接,数据挖掘子系统与规则库和知识库子系统连接,规则库和知识库子系统与实时流子系统连接,大数据存储子系统、规则库和知识库子系统以及实时流计算子系统再分别与可视化子系统连接。上述系统内部结构及调度算法复杂,不适用于本案。
技术实现思路
有鉴于此,本专利技术的目的是提供一种医保反欺诈串换编码挖掘系统及方法,以解决现有技术中的不足。为了达到上述目的,本专利技术的目的是通过下述技术方案实现的:一方面,提供一种医保反欺诈串换编码挖掘系统,其中,作用于第一字符型目录和第二字符型目录,包括依次连接的数据输入模块、数据清理模块、差异度分数模型模块和挖掘串换编码模块,所述数据输入模块用于接收所述第一字符型目录和所述第二字符型目录的名称,所述数据清理模块包括依次连接的字符转换功能块、字符删除功能块、字符拆分功能块、字符排序功能块和数据替换功能块,所述差异度分数模型模块用于建立所述第一字符型目录和所述第二字符型目录之间的差异度分数模型,所述挖掘串换编码模块包括数据筛选功能块、数据分组功能块和数据复核功能块。上述医保反欺诈串换编码挖掘系统,其中,所述差异度分数模型基于所述第一字符型目录和所述第二字符型目录之间的莱文斯坦距离实现。另一方面,提供一种医保反欺诈串换编码挖掘方法,其中,基于如上述系统实现,包括:S1.清理结算明细数据中的第一字符型目录和第二字符型目录,形成新的第一字符型目录和第二字符型目录;S1.1分别将第一字符型目录和第二字符型目录中除中文、英文、数字以外的字符转换为空格;S1.2分别将第一字符型目录和第二字符型目录中大写英文转换为小写英文;S1.3分别将第一字符型目录和第二字符型目录中开头和结尾的空格去掉;S1.4分别将第一字符型目录和第二字符型目录以空格为分隔符进行字符拆分,形成两个字符列表;S1.5分别将拆分第一字符型目录和第二字符型目录字符后形成的字符列表中的字符进行排序;S1.6分别将排序后的第一字符型目录和第二字符型目录字符列表中的字符以空格作为连接,形成新的第一字符型目录和第二字符型目录,替换原来的第一字符型目录和第二字符型目录;S2.对步骤S1操作完之后得到的结算明细数据,建立第一字符型目录和第二字符型目录之间的差异度分数模型;S2.1计算第一字符型目录和第二字符型目录之间的莱文斯坦距离;S2.2计算第一字符型目录和第二字符型目录之间的莱文斯坦比,计算公式为:S2.3计算第一字符型目录和第二字符型目录之间的差异度分数,计算公式为;差异度分数=100*莱文斯坦比S3.挖掘串换医疗项目编码情形;S3.1对医疗结算明细数据进行筛选,筛选出差异度分数小于经验阈值的数据;S3.2根据第一字符型目录和第二字符型目录进行分组,汇总医疗费用金额;S3.3筛选出医疗费用总金额大于经验阈值的数据;S3.4按照医疗收费项目类型进行筛选;S3.5对第一字符型目录和第二字符型目录的组别进行复核,得到串换医疗项目编码情形。本专利技术技术方案的有益效果包括:医保结算信息明细数据量非常大,导致在分析是否存在串换编码情形时,很难进行高效准确的分析,本挖掘串换医疗收费项目编码方法和系统有效地解决了这一问题,目前本系统和方法已经使用在了医保反欺诈提质增效项目中。附图说明图1为本专利技术流程示意图。具体实施方式下面结合附图和具体实施例对本专利技术作进一步说明,但不作为本专利技术的限定。参看图1所示,本专利技术提供一种医保反欺诈串换编码挖掘系统,作用于第一字符型目录和第二字符型目录,包括依次连接的数据输入模块、数据清理模块、差异度分数模型模块和挖掘串换编码模块,数据输入模块用于接收第一字符型目录和第二字符型目录的名称,数据清理模块包括依次连接的字符转换功能块、字符删除功能块、字符拆分功能块、字符排序功能块和数据替换功能块,差异度分数模型模块用于建立第一字符型目录和第二字符型目录之间的差异度分数模型,挖掘串换编码模块包括数据筛选功能块、数据分组功能块和数据复核功能块。优选地,差异度分数模型基于第一字符型目录和第二字符型目录之间的莱文斯坦距离实现。另外,本专利技术医保反欺诈串换编码挖掘方法基于如上述系统实现,包括:S1.清理结算明细数据中的第一字符型目录和第二字符型目录,形成新的第一字符型目录和第二字符型目录;S1.1分别将第一字符型目录和第二字符型目录中除中文、英文、数字以外的字符转换为空格;S1.2分别将第一字符型目录和第二字符型目录中大写英文转换为小写英文;S1.3分别将第一字符型目录和第二字符型目录中开头和结尾的空格去掉;S1.4分别将第一字符型目录和第二字符型目录以空格为分隔符进行字符拆分,形成两个字符列表;S1.5分别将拆分第一字符型目录和第二字符型目录字符后形成的字符列表中的字符进行排序;S1.6分别将排序后的第一字符型目录和第二字符型目录字符列表中的字符以空格作为连接,形成新的第一字符型目录和第二字符型目录,替换原来的第一字符型目录和第二字符型目录;S2.对步骤本文档来自技高网
...

【技术保护点】
1.一种医保反欺诈串换编码挖掘系统,其特征在于,作用于第一字符型目录和第二字符型目录,包括依次连接的数据输入模块、数据清理模块、差异度分数模型模块和挖掘串换编码模块,所述数据输入模块用于接收所述第一字符型目录和所述第二字符型目录的名称,所述数据清理模块包括依次连接的字符转换功能块、字符删除功能块、字符拆分功能块、字符排序功能块和数据替换功能块,所述差异度分数模型模块用于建立所述第一字符型目录和所述第二字符型目录之间的差异度分数模型,所述挖掘串换编码模块包括数据筛选功能块、数据分组功能块和数据复核功能块。/n

【技术特征摘要】
1.一种医保反欺诈串换编码挖掘系统,其特征在于,作用于第一字符型目录和第二字符型目录,包括依次连接的数据输入模块、数据清理模块、差异度分数模型模块和挖掘串换编码模块,所述数据输入模块用于接收所述第一字符型目录和所述第二字符型目录的名称,所述数据清理模块包括依次连接的字符转换功能块、字符删除功能块、字符拆分功能块、字符排序功能块和数据替换功能块,所述差异度分数模型模块用于建立所述第一字符型目录和所述第二字符型目录之间的差异度分数模型,所述挖掘串换编码模块包括数据筛选功能块、数据分组功能块和数据复核功能块。


2.如权利要求1所述医保反欺诈串换编码挖掘系统,其特征在于,所述差异度分数模型基于所述第一字符型目录和所述第二字符型目录之间的莱文斯坦距离实现。


3.一种医保反欺诈串换编码挖掘方法,其特征在于,基于如权利要求1或2所述系统实现,包括:
S1.清理结算明细数据中的第一字符型目录和第二字符型目录,形成新的第一字符型目录和第二字符型目录;
S1.1分别将第一字符型目录和第二字符型目录中除中文、英文、数字以外的字符转换为空格;
S1.2分别将第一字符型目录和第二字符型目录中大写英文转换为小写英文;
S1.3分别将第一字符型目录和第二字符型目录中开头和结尾的空格去掉;
...

【专利技术属性】
技术研发人员:周鹏程
申请(专利权)人:太平洋医疗健康管理有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1