一种基于改进RFM模型的医保参保人员分类方法技术

技术编号:38843210 阅读:21 留言:0更新日期:2023-09-17 09:55
本发明专利技术公开了一种基于改进RFM模型的医保参保人员分类方法,包括:获取参保人员购药数据集;建立改进RFM模型,执行:基于参保人员购药数据集统计对应参保人员的关键指标,包括平均购买时间、购买频次、购买地点数、代办次数和代办人数;将平均购买时间指标逆向标准化,其余指标正向标准化;采用熵值法为标准化后的各项指标赋权;对赋权后的参保人员购药数据集进行聚类,获得各类别的参保人员群体的总监管价值;将全部类别的总监管价值进行排序,比较总监管价值最大的前L个类别的参保人员群体的各项指标价值,将每项指标价值中的最大值作为对应类别的突出特征并进行监管。该方法能够精准监管具有医保违规风险的参保人群,更加智能化。化。化。

【技术实现步骤摘要】
一种基于改进RFM模型的医保参保人员分类方法


[0001]本专利技术属于数据分析
,具体涉及一种基于改进RFM模型的医保参保人员分类方法。

技术介绍

[0002]近年来,随着医疗保险制度的稳步发展和完善,医保覆盖率不断扩大。伴随医保的普及和保障水平的提升,医保违规形势也变得越来越严峻。面对庞大的参保人用户群体和其产生的海量医保刷卡记录,科学分析参保人的医保记录,将参保人进行分类,能够发现具有违规使用医保行为的高风险参保人群,实现对异常参保人的精准定位。对具有违规风险或倾向的参保人群进行精准监管,能够及时阻止医保违规案件的产生或扩大,是保证医保基金安全的有效手段。
[0003]RFM模型是目前在衡量用户价值和用户细分领域常用的方法,其中最近消费时间(Recency)表示用户上一次消费时间到统计节点的时间间隔;消费频率(Frequency)表示在统计时间段内用户的总购买次数;消费金额(Monetary)表示用户在统计时间段内用户的总购买金额。RFM模型本质上就是通过三个维度对一段时间里的用户消费行为进行组合计算,将用户分为多个类型或等级,然后对不同类型的用户群体采取不同措施。
[0004]然而,现有RFM模型在对医保参保人进行分类时面临许多问题。第一,传统RFM模型在建模时考虑的数据特征较少,鉴于如今形式多样的医保违规行为,例如医保卡转借他人使用、本人多地多次购药等,仅在最近消费时间、消费频率和消费金额上对医保参保人进行分类不足以精确划分违规人员集合。第二,传统RFM模型中用最近消费时间(Recency)来反应用户粘性,而参保人在购药的时间维度上具有随机性,最近消费时间这个指标不能够确切地揭示参保人使用医保的时间长短,购药间隔短的风险参保人无法被有效识别;消费金额(Monetary)对参保人购药刷卡行为的风险识别不敏感,因为在购药环节上药品的价格往往不会是购买该药品与否的考虑因素。第三,经典的K

means算法作为一种最常用的聚类算法,常与RFM模型结合使用来对用户进行分类。然而传统K

means算法存在一定局限性,首先k值的选取是由人为设定的,而依靠人工经验选取合适的k值十分困难。其次K

means的初始聚类中心是随机选取的,这样容易导致算法收敛很慢,对运行时间和最后的结果都有很大影响。另外当数据的特征增加、出现噪音维度或者各特征的重要性并不一致时,算法在计算样本间距离时一并统一考虑,最终导致聚类精度下降。

技术实现思路

[0005]本专利技术的目的在于针对上述问题,提出一种基于改进RFM模型的医保参保人员分类方法,能够精准监管具有医保违规风险的参保人群,更加智能化。
[0006]为实现上述目的,本专利技术所采取的技术方案为:
[0007]本专利技术提出的一种基于改进RFM模型的医保参保人员分类方法,包括如下步骤:
[0008]S1、获取参保人员购药刷卡信息并进行预处理,形成参保人员购药数据集;
[0009]S2、建立改进RFM模型,改进RFM模型执行如下操作:
[0010]S21、基于参保人员购药数据集统计出对应参保人员的关键指标,关键指标包括平均购买时间R1、购买频次F、购买地点数P、代办次数S和代办人数S1共五项指标,购买地点数P为对刷卡药店编号集合去重后的元素个数,代办人数S1为对代办人身份证号集合去重后的元素个数,平均购买时间R1计算如下:
[0011][0012]式中,T
last_time
表示在预设参考时间段内参保人员最后一次购药的时间,T
first_time
表示在预设参考时间段内参保人员第一次购药的时间;
[0013]S22、将平均购买时间R1指标进行逆向标准化,将购买频次F、购买地点数P、代办次数S和代办人数S1指标进行正向标准化;
[0014]S23、采用熵值法为标准化后的各项指标赋权,形成赋权后的参保人员购药数据集,各项指标的赋权公式如下:
[0015]V
i

j
=W
j
V
ij
,j=1,...,5
[0016]式中,W
j
为第j项指标的权重,V
ij
为第i个参保人员的第j项指标的标准化值,V
i

j
为第i个参保人员的第j项指标赋权后的值;
[0017]S3、对赋权后的参保人员购药数据集采用聚类算法进行聚类,获得k个不同类别的参保人员群体,计算出第l个类别的参保人员群体的总监管价值V
l
,公式如下:
[0018][0019]式中,表示第l个类别的平均购买时间的指标价值,F
l
表示第l个类别的购买频次的指标价值,P
l
表示第l个类别的购买地点数的指标价值,S
l
表示第l个类别的代办次数的指标价值,表示第l个类别的代办人数的指标价值,指标价值即为对应指标的平均值;
[0020]S4、将全部类别的参保人员群体的总监管价值进行排序,比较总监管价值最大的前L个类别的参保人员群体的各项指标价值,L≤k,将每项指标价值中的最大值作为对应类别的突出特征并进行监管。
[0021]优选地,预处理,具体如下:
[0022]S11、筛选出预设参考时间段的参保人员购药刷卡信息;
[0023]S12、在筛选出的参保人员购药刷卡信息中过滤掉具有缺失值、异常数据和冗余数据的参保人员购药刷卡信息;
[0024]S13、在余留的参保人员购药刷卡信息中筛选字段,字段包括医保卡主身份证号、刷卡时间、刷卡药店编号、是否代办购药和代办人身份证号。
[0025]优选地,缺失值为预设参考时间段内只有单次购药记录的参保人员购药刷卡信息,异常数据为身份校验失败、药店编号校验失败的参保人员购药刷卡信息,冗余数据为单次购药时由于人脸比对不成功而进行多次比对时产生的冗余失败购药记录。
[0026]优选地,逆向标准化,公式如下:
[0027][0028]正向标准化,公式如下:
[0029][0030]式中,V
ij
为第i个参保人员的第j项指标的标准化值,X
ij
为第i个参保人员的第j项指标值,i=1,2,...,n,n为参保人员购药数据集中的参保人员总数,依次将平均购买时间R1、购买频次F、购买地点数P、代办次数S和代办人数S1编号为第1~5项指标。
[0031]优选地,第j项指标的权重W
j
计算如下:
[0032][0033]其中,
[0034][0035][0036]式中,E
j
为第j项指标的信息熵值,P
ij
为第i个参保人员的第j项指标所占比重。
[0037]优选地,聚类算法,执行如下操作:
[0038]S31、遍历预设分类簇数t的取值,对每一个t值进行初本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进RFM模型的医保参保人员分类方法,其特征在于:所述基于改进RFM模型的医保参保人员分类方法包括如下步骤:S1、获取参保人员购药刷卡信息并进行预处理,形成参保人员购药数据集;S2、建立改进RFM模型,所述改进RFM模型执行如下操作:S21、基于参保人员购药数据集统计出对应参保人员的关键指标,所述关键指标包括平均购买时间R1、购买频次F、购买地点数P、代办次数S和代办人数S1共五项指标,所述购买地点数P为对刷卡药店编号集合去重后的元素个数,所述代办人数S1为对代办人身份证号集合去重后的元素个数,所述平均购买时间R1计算如下:式中,T
last_time
表示在预设参考时间段内参保人员最后一次购药的时间,T
first_time
表示在预设参考时间段内参保人员第一次购药的时间;S22、将平均购买时间R1指标进行逆向标准化,将购买频次F、购买地点数P、代办次数S和代办人数S1指标进行正向标准化;S23、采用熵值法为标准化后的各项指标赋权,形成赋权后的参保人员购药数据集,各项指标的赋权公式如下:V
i

j
=W
j
V
ij
,j=1,...,5式中,W
j
为第j项指标的权重,V
ij
为第i个参保人员的第j项指标的标准化值,V
i

j
为第i个参保人员的第j项指标赋权后的值;S3、对赋权后的参保人员购药数据集采用聚类算法进行聚类,获得k个不同类别的参保人员群体,计算出第l个类别的参保人员群体的总监管价值V
l
,公式如下:式中,表示第l个类别的平均购买时间的指标价值,F
l
表示第l个类别的购买频次的指标价值,P
l
表示第l个类别的购买地点数的指标价值,S
l
表示第l个类别的代办次数的指标价值,表示第l个类别的代办人数的指标价值,指标价值即为对应指标的平均值;S4、将全部类别的参保人员群体的总监管价值进行排序,比较总监管价值最大的前L个类别的参保人员群体的各项指标价值,L≤k,将每项指标价值中的最大值作为对应类别的突出特征并进行监管。2.如权利要求1所述的基于改进RFM模型的医保参保人员分类方法...

【专利技术属性】
技术研发人员:郑河荣应铎
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1