一种海量医疗保险数据智能信息检索系统技术方案

技术编号：38438692 阅读：11 留言：0更新日期：2023-08-11 14:22

本发明专利技术涉及电子数字数据处理技术领域，具体涉及一种海量医疗保险数据智能信息检索系统，包括：根据保险数据中具有不同既往病例时，不同年龄和不同性别下保险数据对应数量之间的关系，获得保险数据对应的风险率和检索概率，根据检索概率的大小对保险数据进行编码压缩。本发明专利技术通过联系保险数据中不同特征的关系，提高了逻辑回归模型对保险数据的风险率评估结果的稳定性和准确性，并根据检索概率大小对保险数据进行编码压缩，避免高检索概率的保险数据编码过长的问题，极大提高了在数据检索过程中的效率和速度。过程中的效率和速度。过程中的效率和速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种海量医疗保险数据智能信息检索系统

[0001]本专利技术涉及电子数字数据处理
，具体涉及一种海量医疗保险数据智能信息检索系统。

技术介绍

[0002]随着社会的发展和人口老龄化趋势的加剧，医疗保险行业扮演着越来越重要的角色，医疗保险的核心是数据，而医疗保险数据的处理和管理对于保险公司来说是一个非常重要的任务。然而，传统的数据管理方式已经难以满足对于庞大保险数据的高效处理和检索需求，海量保险数据处理需要大量的时间和资源，容易出现数据冗余、重复等问题，数据检索效率低下等问题。因此，需要一种新的智能化的海量医疗保险数据信息检索系统，能够利用机器学习算法分析、编码医疗保险数据，实现数据的压缩和结构化编码，同时提高数据检索效率和准确性，以满足医疗保险行业的需求。
[0003]目前，对于医疗保险信息进行检索时，采用现有的字符匹配技术，然而这种方法存在以下缺陷：1.存储空间浪费。在传统的关系数据库中，每一条数据都需要存储各个属性的值，存在大量冗余数据。2.检索效率低下。在数据量庞大的情况下，传统的字符串匹配和模糊查询带来的效率问题将会越来越明显。

技术实现思路

[0004]本专利技术提供一种海量医疗保险数据智能信息检索系统，以解决现有的问题。
[0005]本专利技术的一种海量医疗保险数据智能信息检索系统采用如下技术方案：本专利技术提供了一种海量医疗保险数据智能信息检索系统，该系统包括以下模块：数据准备模块：采集医疗保险信息数据库中的保险数据，获得第一数据集和第二数据集；数据划分模块：用于将...

【技术保护点】

【技术特征摘要】
1.一种海量医疗保险数据智能信息检索系统，其特征在于，该系统包括以下模块：数据准备模块：采集医疗保险信息数据库中的保险数据，获得第一数据集和第二数据集；数据划分模块：用于将第一数据集进行划分，获得训练集和验证集；概率分析模块：用于获取第一数据集中若干个既往病例，根据具有任意既往病例下不同年龄的人数，获得既往病例与年龄之间的相关因子；结合相关因子获取既往病例与年龄之间的联系参数；进一步结合联系参数获得既往病例的特征参数；根据特征参数获得第二数据集中保险数据的风险率，结合风险率获得保险数据的检索概率；数据存储模块：根据检索概率的大小，获得首要编码数据，对首要编码数据进行编码压缩存储，进一步实现保险数据的快速检索。2.根据权利要求1所述一种海量医疗保险数据智能信息检索系统，其特征在于，所述第一数据集和第二数据集，获取方法如下：将医疗保险数据库中所有保险数据形成的集合，记为保险数据集；将保险数据集中由已经赔付过的医疗保险信息所对应的保险数据形成的集合，记为第一数据集；将保险数据集中投保人正在使用的医疗保险所对应的所有数据形成的集合，记为第二数据集。3.根据权利要求1所述一种海量医疗保险数据智能信息检索系统，其特征在于，所述训练集和验证集，获取方法如下：首先，利用K
‑
means++算法，根据各个保险数据中对应投保人的年龄、性别以及既往病例三个维度之间的距离，对第一数据集中的所有保险数据进行聚类，获得多个聚类簇；然后，对所有聚类簇利用randomshuffling算法进行置乱；最后，每个聚类簇按照预设比例进行划分，分别得到训练集和验证集。4.根据权利要求1所述一种海量医疗保险数据智能信息检索系统，其特征在于，所述概率分析模块，包括单元如下：多元数据集单元：提取训练集中不同保险数据对应投保人的既往病例的病例名称，获得由所有既往病例形成的集合，记为多元数据集；联系参数单元：用于根据既往病例下不同年龄的人数与所有既往病例下人数的平均值之间的差异，获得既往病例与年龄之间的相关因子；获取不同年龄下具有任意既往病例时的赔付概率，结合不同年龄区间下具有任意既往病例的人数之间的差异以及相关因子，获得既往病例与年龄之间的联系参数；特征参数单元：获取不同性别下的赔付概率，结合联系参数获得既往病例的特征参数；风险率单元：将训练集中所有既往病例的特征参数作为自变量，进行逻辑回归模型训练，并利用验证集中所有既往病例的特征参数，对训练的逻辑回归模型进行优化，获得用于保险数据的风险率评估的逻辑回归模型；获取第二数据集中所有既往病例的特征参数，并作为逻辑回归模型的输入，输出为各个既往病例对应保险数据的风险率；检索概率单元：获取保险数据被检索的时间和医疗保险信息数据库的更新时间，结合风险率，获得第二数据集中保险数据的检索概率。5.根据权利要求...

【专利技术属性】
技术研发人员：刘利锋，
申请(专利权)人：北京环球医疗救援有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人