基于健康医疗大数据的保险客户名单筛选方法及装置制造方法及图纸

技术编号:26971357 阅读:40 留言:0更新日期:2021-01-06 00:02
本发明专利技术公开了一种基于健康医疗大数据的保险客户名单筛选方法及装置,属于医疗大数据的语义处理及语义分析技术领域,本发明专利技术要解决的技术问题为现有技术中针对用户筛选分析时基于单一数据源的单一指标分析,而无法多维度精确筛选客户,采用的技术方案为:该方法具体如下:输入保险客户信息;查找及提取医疗数据:通过客户信息从医疗健康大数据中查找该客户的医疗数据,并提取该客户的医疗数据;语义标准化处理:对找到的客户医疗数据进行语义标准化处理,生成具有语义关系的客户标准化数据,进而形成客户医疗语义网;语义匹配:将筛选规则库与客户医疗语义网进行语义匹配;获得客户筛选结果。

【技术实现步骤摘要】
基于健康医疗大数据的保险客户名单筛选方法及装置
本专利技术涉及医疗大数据的语义处理及语义分析
,特别是保险客户筛选领域的医疗大数据的语义处理与语义分析技术,具体地说是一种基于健康医疗大数据的保险客户名单筛选方法及装置。
技术介绍
近些年,随着社会经济和医疗体制改革的发展,商业健康险通过提供保险保障、整合服务供给、加强产业整合等方式,深度参与“三医联动”,成为深化医改的助推器,在参与社会民生工程和医疗保障体系建设中取得了长足进步。但是,经营风险高、赔付率和赔付额高、盈利难等因素制约着商业健康险的持续发展,这使得风控管理成为商业健康险发展的重中之重,而投保过程中对客户信用和客户优质度进行筛选是风控管理的重要环节之一。目前客户筛选方式有很多,平安科技根据经验积累的黑名单判断规则以及客户运营数据分析客户标签对保险投保客户进行筛选;武汉泰乐奇基于医学教育数据进行客户筛选;平安科技还通过自动爬取客户个人实体维度信息(犯罪信息、金融预期信息等信息)和企业法人信息(企业诉讼信息、食品药品监督局黑名单信息等信息)等多维度信息进行黑名单筛选。可见,目本文档来自技高网...

【技术保护点】
1.一种基于健康医疗大数据的保险客户名单筛选方法,其特征在于,该方法具体如下:/n输入保险客户信息;/n查找及提取医疗数据:通过客户信息从医疗健康大数据中查找该客户的医疗数据,并提取该客户的医疗数据;/n语义标准化处理:对找到的客户医疗数据进行语义标准化处理,生成具有语义关系的客户标准化数据,进而形成客户医疗语义网;/n语义匹配:将筛选规则库与客户医疗语义网进行语义匹配;/n获得客户筛选结果。/n

【技术特征摘要】
1.一种基于健康医疗大数据的保险客户名单筛选方法,其特征在于,该方法具体如下:
输入保险客户信息;
查找及提取医疗数据:通过客户信息从医疗健康大数据中查找该客户的医疗数据,并提取该客户的医疗数据;
语义标准化处理:对找到的客户医疗数据进行语义标准化处理,生成具有语义关系的客户标准化数据,进而形成客户医疗语义网;
语义匹配:将筛选规则库与客户医疗语义网进行语义匹配;
获得客户筛选结果。


2.根据权利要求1所述的基于健康医疗大数据的保险客户名单筛选方法,其特征在于,客户信息包括客户身份信息,客户身份信息包括姓名、性别、出生日期、地址、身份证号码和电话。


3.根据权利要求1或2所述的基于健康医疗大数据的保险客户名单筛选方法,其特征在于,查找及提取医疗数据具体如下:
通过客户查找方法进行精确匹配,并将查找到的客户记录整合去重;其中,客户查找方法包括如下两种方式:
两要素客户查找方法:身份证+姓名;
五要素客户查找方法:姓名+性别+出生日期+地址+电话;
根据去重后的客户记录,从医疗健康大数据中提取该客户的全生命周期的医疗数据;其中,医疗健康大数据包括临床诊断数据、临床用药数据、检查检验数据、手术数据、临床费用结算数据、电子病历数据、医保参保数据和医保结算数据;
将该客户的全生命周期的医疗健康大数据以时间为主线串联形成各维度各类型的就诊数据。


4.根据权利要求1所述的基于健康医疗大数据的保险客户名单筛选方法,其特征在于,语义标准化处理是指基于医学标准词表和命名实体识别技术,从医疗数据中自动抽取出医疗术语,并对医疗术语进行概念上的归一和规范,进而形成医疗概念语义网;
其中,医疗标准词表是在ICD10基础上,扩建等同关系和属分关系的概念后得到的体现语义关系的医疗标准词表;
医疗标准词表分为树状结构表和字顺表;
树状结构表包括树状结构号、标准术语编码及术语名称;树状结构表用于体现词与词之间的语义属分关系;
字顺表包括术语名称、标准名称及术语编码;字顺表用于体现词与词之间的等同关系。


5.根据权利要求1或4所述的基于健康医疗大数据的保险客户名单筛选方法,其特征在于,所述筛选规则库是指多维度的筛选指标体系,多维度的筛选指标体系分为三层,分别为第一类指标、第二类指标和第三类指标;
其中,第一类指标包括诊断信息;其中,诊断信息的指标判断规则为诊断ICD10编码是否符合规则表,规则表为事先编制的黑名单客户疾病编码表;
第二类指标包括医院名称、就诊科室、手术信息、药品名称、检查名称、检验名称及医保大病保险支付基金;其中,医院名称的指标判断规则为医院名称中是否包含肿瘤字样的医院名称;就诊科室的指标判断规则为科室名称中包含医院名称中是否包含肿瘤字样的科室名称;手术信息的指标判断规则为手术ICD9-CM3编码是否符合规则表,规则表为事先编制的高风险客户手术编码表;药品名称的指标判断规则为药品名称是否符合规则表,规则表为事先编制的高风险客户药品名称表;检查名称的指标判断规则为检查名称是否符合规则表,规则表为事先编制的高风险客户影像检查名称表;检验名称的指标判断规则为检验名称是否符合规则表以及检查结果异常字段是否为是,规则表为事先编制的高风险客户实验室检查名称表;医保大病保险支付基金的指标判断规则为医保大病保险支付基金是否有值;
第三类指标包括就诊次数、BMI、职业、血压、参保状态和结算费用;就诊次数的指标判断规则为该客户所有就诊号个数判断是否大于10次/年;BMI的指标...

【专利技术属性】
技术研发人员:黄玉丽
申请(专利权)人:山东健康医疗大数据有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1