【技术实现步骤摘要】
一种相似群体确定方法、装置和存储介质
[0001]本专利技术涉及人工智能领域,尤其涉及一种相似群体确定方法、装置和存储介质。
技术介绍
[0002]社会医疗保险为病患群体有效降低了经济风险,提升广大人民的健康水平。但是由于社会医疗保险在管理制度、执行流程等方面具有漏洞,一些人为了个人的利益,在报销规则上钻空子,利用伪造发票、重复就诊、重复开药、冒名就医、支付非医保药费或诊疗项目等各种方式骗取医保基金,导致医保基金大量流失。此外,一些人与医院部分医生形成团伙,在医院通过团体住院、团体开药等手段虚构或夸大治疗费用,骗取社会医疗保险。
[0003]传统的医保反欺诈方法主要基于通过解读医保政策文件、医生治疗经验、病人诊断信息等业务分析方法来识别医保报销中的违规行为。此外,一些异常数据检测方法通过识别病人数据中的异常指标,从而挖掘可能存在欺诈的行为。对病人的特征进行有效刻画,形成可解释性的病人异常行为判定方法,可以充分利用病人数据挖掘潜在的医保报销异常行为,从而补充基于业务分析反欺诈方法的不足,提升医保反欺诈的成功率。由于病人 ...
【技术保护点】
【技术特征摘要】
1.一种相似群体确定方法,其特征在于,所述方法包括:获取病人住院特征;根据所述病人住院特征,构建病人住院日期相似度的矩阵和病人基本属性相似度的矩阵;所述病人住院日期相似度通过Wasserstein距离表征;根据所述病人住院日期相似度的矩阵和所述病人基本属性相似度的矩阵,构建病人特征相似度的图模型;根据所述病人特征相似度的图模型进行极大团处理,得到至少一个极大团;根据所述至少一个极大团,确定目标极大团。2.根据权利要求1所述的方法,其特征在于,所述病人住院特征,包括:病人住院日期特征;根据所述病人住院日期特征,构建所述病人住院日期相似度的矩阵,包括:确定每个病人每次住院的住院起始时间和住院天数;根据每个病人每次住院的所述住院起始时间和所述住院天数,确定每个病人的第一住院时间序列;通过高斯混合函数或高斯分布密度函数对所述第一住院时间序列进行拟合,得到第二住院时间序列;根据任意两个病人中每个病人的第二住院时间序列进行Wasserstein距离的计算,得到计算结果;根据任意两个病人之间的所述计算结果,构建所述病人住院日期相似度的矩阵。3.根据权利要求2所述的方法,其特征在于,所述病人住院日期相似度的矩阵,包括:任意两个病人的病人住院日期的相似度结果;所述根据任意两个病人之间的所述计算结果,构建病人住院日期相似度的矩阵,包括:相应于两个病人之间的所述计算结果超过住院时间相似度阈值,确定所述两个病人的病人住院日期的相似度结果为1;相应于两个病人之间的所述计算结果小于或等于住院时间相似度阈值,确定所述两个病人的病人住院日期的相似度结果为0。4.根据权利要求2所述的方法,其特征在于,所述通过高斯混合函数或高斯分布密度函数对所述第一住院时间序列进行拟合,得到第二住院时间序列,包括:相应于病人的住院次数超过第一阈值时,运用高斯混合函数对所述第一住院时间序列进行拟合,得到第二住院时间序列;相应于病人的住院次数小于或等于第一阈值时,运用高斯分布密度函数对所述第一住院时间序列进行拟合,得到第二住院时间序列。5.根据权利要求1所述的方法,其特征在于,所述病人住院特征,包括:病人基本属性;所述根据所述病人基本属性,构建病人基本属性相似度的矩阵,包括:根据每个病人的所述病人基本属性,构建每个病人的基本属性特征向量...
【专利技术属性】
技术研发人员:王础,赵学峰,羊威,鲁红霞,李旭川,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。