一种基于改进RFM模型的医保参保人员分类方法技术

技术编号：38843210 阅读：21 留言：0更新日期：2023-09-17 09:55

本发明专利技术公开了一种基于改进RFM模型的医保参保人员分类方法，包括：获取参保人员购药数据集；建立改进RFM模型，执行：基于参保人员购药数据集统计对应参保人员的关键指标，包括平均购买时间、购买频次、购买地点数、代办次数和代办人数；将平均购买时间指标逆向标准化，其余指标正向标准化；采用熵值法为标准化后的各项指标赋权；对赋权后的参保人员购药数据集进行聚类，获得各类别的参保人员群体的总监管价值；将全部类别的总监管价值进行排序，比较总监管价值最大的前L个类别的参保人员群体的各项指标价值，将每项指标价值中的最大值作为对应类别的突出特征并进行监管。该方法能够精准监管具有医保违规风险的参保人群，更加智能化。化。化。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进RFM模型的医保参保人员分类方法

[0001]本专利技术属于数据分析
，具体涉及一种基于改进RFM模型的医保参保人员分类方法。

技术介绍

[0002]近年来，随着医疗保险制度的稳步发展和完善，医保覆盖率不断扩大。伴随医保的普及和保障水平的提升，医保违规形势也变得越来越严峻。面对庞大的参保人用户群体和其产生的海量医保刷卡记录，科学分析参保人的医保记录，将参保人进行分类，能够发现具有违规使用医保行为的高风险参保人群，实现对异常参保人的精准定位。对具有违规风险或倾向的参保人群进行精准监管，能够及时阻止医保违规案件的产生或扩大，是保证医保基金安全的有效手段。
[0003]RFM模型是目前在衡量用户价值和用户细分领域常用的方法，其中最近消费时间(Recency)表示用户上一次消费时间到统计节点的时间间隔；消费频率(Frequency)表示在统计时间段内用户的总购买次数；消费金额(Monetary)表示用户在统计时间段内用户的总购买金额。RFM模型本质上就是通过三个维度对一段时间里的用户消费行为进行组合计算，将用户分为多个类型或等级，然后对不同类型的用户群体采取不同措施。
[0004]然而，现有RFM模型在对医保参保人进行分类时面临许多问题。第一，传统RFM模型在建模时考虑的数据特征较少，鉴于如今形式多样的医保违规行为，例如医保卡转借他人使用、本人多地多次购药等，仅在最近消费时间、消费频率和消费金额上对医保参保人进行分类不足以精确划分违规人员集合。第二，传统RFM模型中用最近消费时间(Recen...

【技术保护点】

【技术特征摘要】
1.一种基于改进RFM模型的医保参保人员分类方法，其特征在于：所述基于改进RFM模型的医保参保人员分类方法包括如下步骤：S1、获取参保人员购药刷卡信息并进行预处理，形成参保人员购药数据集；S2、建立改进RFM模型，所述改进RFM模型执行如下操作：S21、基于参保人员购药数据集统计出对应参保人员的关键指标，所述关键指标包括平均购买时间R1、购买频次F、购买地点数P、代办次数S和代办人数S1共五项指标，所述购买地点数P为对刷卡药店编号集合去重后的元素个数，所述代办人数S1为对代办人身份证号集合去重后的元素个数，所述平均购买时间R1计算如下：式中，T
last_time
表示在预设参考时间段内参保人员最后一次购药的时间，T
first_time
表示在预设参考时间段内参保人员第一次购药的时间；S22、将平均购买时间R1指标进行逆向标准化，将购买频次F、购买地点数P、代办次数S和代办人数S1指标进行正向标准化；S23、采用熵值法为标准化后的各项指标赋权，形成赋权后的参保人员购药数据集，各项指标的赋权公式如下：V
i
′
j
＝W
j
V
ij
,j＝1,...,5式中，W
j
为第j项指标的权重，V
ij
为第i个参保人员的第j项指标的标准化值，V
i
′
j
为第i个参保人员的第j项指标赋权后的值；S3、对赋权后的参保人员购药数据集采用聚类算法进行聚类，获得k个不同类别的参保人员群体，计算出第l个类别的参保人员群体的总监管价值V
l
，公式如下：式中，表示第l个类别的平均购买时间的指标价值，F
l
表示第l个类别的购买频次的指标价值，P
l
表示第l个类别的购买地点数的指标价值，S
l
表示第l个类别的代办次数的指标价值，表示第l个类别的代办人数的指标价值，指标价值即为对应指标的平均值；S4、将全部类别的参保人员群体的总监管价值进行排序，比较总监管价值最大的前L个类别的参保人员群体的各项指标价值，L≤k，将每项指标价值中的最大值作为对应类别的突出特征并进行监管。2.如权利要求1所述的基于改进RFM模型的医保参保人员分类方法...

【专利技术属性】
技术研发人员：郑河荣，应铎，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人