基于知识图谱的数据对码方法、装置、设备和存储介质制造方法及图纸

技术编号:30831724 阅读:29 留言:0更新日期:2021-11-18 12:47
本申请涉及人工智能技术领域,提供一种基于知识图谱的数据对码方法、装置、计算机设备和存储介质,方法包括:获取医疗清单数据;将项目数据输入目标文本分类模型,获取与项目数据对应的文本分类结果;若文本分类结果属于医保目录分类结果,从知识图谱查找与文本分类结果对应的类别节点;对项目数据进行预处理得到关键词;从知识图谱中获取与类别节点对应的多条第一链路,从所有第一链路中确定出与所有关键词匹配的目标链路;获取与目标链路对应的目标医疗编码;将目标医疗编码作为项目数据的对码结果。本申请能够准确实现对于医疗清单数据中的项目数据的对码处理。本申请还可以应用于区块链领域,上对码结果等数据可以存储于区块链上。上。上。

【技术实现步骤摘要】
基于知识图谱的数据对码方法、装置、设备和存储介质


[0001]本申请涉及人工智能
,具体涉及一种基于知识图谱的数据对码方法、装置、设备和存储介质。

技术介绍

[0002]当前在用户去医保局进行医保报销时,需要对用户提供的医疗清单数据,如住院清单数据中符合报销要求的项目数据进行对码操作,再基于对码操作得到的编码数据进行相应的费用结算处理。现有对医疗清单数据进行对码操作通常是由医保局的工作人员依靠自己的工作经验以及查阅医保三目录表来进行的,这样基于人工的数据对码处理方式存在耗时耗力,处理效率低,且生成的编码数据的准确性较低的问题。

技术实现思路

[0003]本申请的主要目的为提供一种基于知识图谱的数据对码方法、装置、计算机设备和存储介质,旨在解决现有对医疗清单数据进行对码操作时,基于人工的数据对码处理方式存在耗时耗力,处理效率低,且生成的编码数据的准确性较低的技术问题。
[0004]本申请提出一种基于知识图谱的数据对码方法,所述方法包括步骤:
[0005]获取待处理的医疗清单数据;其中,所述医疗清单数据包括项目本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的数据对码方法,其特征在于,包括:获取待处理的医疗清单数据;其中,所述医疗清单数据包括项目数据;将所述项目数据输入至预设的目标文本分类模型,获取所述目标文本分类模型输出的与所述项目数据对应的文本分类结果;判断所述文本分类结果是否属于预设的医保目录分类结果;若是,从预设的知识图谱中查找出与所述文本分类结果对应的类别节点;对所述项目数据进行文本预处理得到对应的关键词;其中,所述关键词的数量包括多个;从所述知识图谱中获取与所述类别节点对应的多条第一链路,并基于所述关键词对所有所述第一链路进行匹配处理,从所有所述第一链路中确定出与所有所述关键词匹配的目标链路;获取与所述目标链路对应的目标医疗编码;将所述目标医疗编码作为所述项目数据的对码结果。2.根据权利要求1所述的基于知识图谱的数据对码方法,其特征在于,所述将所述项目数据输入至预设的目标文本分类模型,获取所述目标文本分类模型输出的与所述项目数据对应的文本分类结果的步骤之前,包括:调用预先训练好的预设数量的文本分类模型;其中,每一个所述文本分类模型是基于各自不同的训练样本集对预设的初始文本分类模型进行训练生成的,所述训练样本集的数量等于所述预设数量;基于预设的验证样本集生成各所述文本分类模型的分类准确度;获取预设的分类准确度阈值,从所有所述文本分类模型中筛选出分类准确度大于所述准确度阈值的第一文本分类模型;基于所述验证样本集生成各所述第一文本分类模型的模型处理时间;获取与所述分类准确度对应的第一权重,以及获取与所述模型处理时间对应的第二权重;基于各所述第一文本分类模型的分类准确度、所述模型处理时间、所述第一权重与所述第二权重,计算生成各所述第一文本分类模型的评测得分;从所有所述第一文本分类模型中筛选出评测得分最高的第二文本分类模型;将所述第二文本分类模型作为所述目标文本分类模型。3.根据权利要求2所述的基于知识图谱的数据对码方法,其特征在于,所述基于预设的验证样本集生成各所述文本分类模型的分类准确度的步骤,包括:获取所述验证样本集;其中,所述验证数据集包括多个验证数据,以及与各所述验证数据分别对应的类别信息;分别将各所述验证数据输入至第三文本分类模型中,获取所述第三文本分类模型输出的与各所述验证数据分别对应的第一分类结果;其中,所述第三文本分类模型为所有所述文本分类模型中的任意一个模型;基于与各所述验证数据分别对应的类别信息,获取所有所述第一分类结果中预测正确的第二分类结果;获取所述第一分类结果的第一数量,以及获取所述第二分类结果的第二数量;
计算所述第二数量与所述第一数量的第一商值;将所述第一商值作为所述第三文本分类模型的分类准确度。4.根据权利要求2所述的基于知识图谱的数据对码方法,其特征在于,所述基于所述验证样本集生成各所述第一文本分类模型的模型处理时间的步骤,包括:获取所述验证样本集;其中,所述验证数据集包括多个验证数据,以及与各所述验证数据分别对应的类别信息;在第四文本分类模型获取到每一个所述验证数据时,分别统计所述第四文本分类模型输出与每一个所述验证数据分别对应的第三分类结果的第一处理...

【专利技术属性】
技术研发人员:黎安
申请(专利权)人:平安医疗健康管理股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1