行为判别模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:28943348 阅读:25 留言:0更新日期:2021-06-18 21:52
本发明专利技术实施例公开了一种行为判别模型的训练方法、装置、电子设备及存储介质。包括:通过标记样本集训练得到初始行为判别模型,并将未标记样本集输入至初始行为判别模型中,得到未标记样本集中各未标记样本对应的行为分类结果;基于各未标记样本以及各未标记样本对应的行为分类结果,对标记样本集进行更新,以基于更新后的标记样本集对初始行为判别模型进行更新训练,得到目标行为判别模型。本发明专利技术实施例的行为判别模型的训练方法,无需大量人工标注数据,节省了人工标注的时间与成本,进而提高了模型的训练速度;并且,通过未标记样本集的预测结果对标记样本集进行更新,以基于更新的标记样本集对模型进行更新训练,显著提高了模型的输出精度。

【技术实现步骤摘要】
行为判别模型的训练方法、装置、电子设备及存储介质
本专利技术实施例涉及计算机
,尤其涉及一种行为判别模型的训练方法、装置、电子设备及存储介质。
技术介绍
医疗保险欺诈行为,一般是指参保人或医疗机构,以某种特定的模式来套取医保基金的行为。比如,超量购药、虚假计费、不合理住院等行为。对于医疗保险欺诈行为的检测,一般需要根据实际业务场景,结合该场景下参保人或机构的行为指标特征,进行检测识别。其一般方法包括有监督学习训练方法和无监督学习训练方法。其中,有监督学习训练方法为:根据业务场景,结合医学常识,人工标注医疗保险欺诈数据,并利用标注出来的数据样本进行有监督学习训练,得到模型可用于未标注样本检测;无监督学习训练方法为:利用无监督学习,如Kmeans、DBSCAN等聚类算法,对样本集进行聚类,并结合医学知识库人为筛选异常组。然而,上述方法存在以下缺陷:有监督学习训练方法准确率相对较高,但是需要大量人工标注数据,而人工标注的时间和人力成本较高。无监督学习训练方法无需人工标注,但准确率较低。专利技术内容本专利技本文档来自技高网...

【技术保护点】
1.一种行为判别模型的训练方法,其特征在于,包括:/n获取标记样本集和未标记样本集;/n基于所述标记样本集训练得到初始行为判别模型,将所述未标记样本集输入至所述初始行为判别模型,生成所述未标记样本集中各未标记样本对应的行为分类结果;/n基于所述行为分类结果以及所述行为分类结果对应的未标记样本更新所述标记样本集,基于更新后的标记样本集对所述初始行为判别模型进行更新训练,得到目标行为判别模型。/n

【技术特征摘要】
1.一种行为判别模型的训练方法,其特征在于,包括:
获取标记样本集和未标记样本集;
基于所述标记样本集训练得到初始行为判别模型,将所述未标记样本集输入至所述初始行为判别模型,生成所述未标记样本集中各未标记样本对应的行为分类结果;
基于所述行为分类结果以及所述行为分类结果对应的未标记样本更新所述标记样本集,基于更新后的标记样本集对所述初始行为判别模型进行更新训练,得到目标行为判别模型。


2.根据权利要求1所述的方法,其特征在于,所述基于所述行为分类结果以及所述行为分类结果对应的未标记样本更新所述标记样本集,基于更新后的标记样本集对所述初始行为判别模型进行更新训练,得到目标行为判别模型,包括:
基于所述行为分类结果以及所述行为分类结果对应的未标记样本,更新所述标记样本集以及所述未标记样本集;
若更新后的未标记样本集非空,则基于当前更新后的标记样本集对所述初始行为判别模型进行更新训练得到更新行为判别模型,并基于所述更新行为判别模型对当前的所述未标记样本集中各未标记样本进行分类处理得到行为分类结果,根据所述行为分类结果以及所述行为分类结果对应的未标记样本循环更新所述标记样本集以及所述未标记样本集,直至更新后的未标记样本集为空。


3.根据权利要求2所述的方法,其特征在于,所述基于所述行为分类结果以及所述行为分类结果对应的未标记样本,更新所述标记样本集以及所述未标记样本集,包括:
基于各所述行为分类结果的置信度确定置信分类结果;
在所述未标记样本集中剔除所述置信分类结果对应的未标记样本,并将所述置信分类结果以及所述置信分类结果对应的未标记样本添加至所述标记样本集。


4.根据权利要求3所述的方法,其特征在于,所述基于各所述行为分类结果的置信度确定置信分类结果,包括:
将满足置信度阈值条件的行为分类结果确定为置信分类结果;或者,
根据所述各未标记样本对应的行...

【专利技术属性】
技术研发人员:金欣哲孟海忠
申请(专利权)人:挂号网杭州科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1