【技术实现步骤摘要】
一种多医疗机构下的病例数据抽取方法及其相关设备
[0001]本申请涉及智慧医疗
,尤其涉及一种多医疗机构下的病例数据抽取方法及其相关设备。
技术介绍
[0002]智慧医疗,英文简称WITMED,是最近兴起的专有医疗名词,通过打造健康档案区域医疗信息平台,利用最先进的物联网技术,实现患者与医务人员、医疗机构、医疗设备之间的互动,逐步达到信息化。由于国内公共医疗管理系统的不完善,医疗成本高、渠道少、覆盖面低等问题困扰着大众民生。
[0003]因此,我们需要建立一套智慧的医疗信息网络平台体系,使患者用较短的等疗时间、支付基本的医疗费用,就可以享受安全、便利、优质的诊疗服务。目前,现有技术在对传统医疗进行智慧医疗升级打的过程中,对综合医疗档案和跨区域间的医疗合作上进行改进已经成为了一项热门的话题,但是,在具体实施上,特别是跨区域多医疗机构间的病例数据获取上,往往涉及的接收端与被采集端之间数据传输交互次数过多,获取信息繁杂无统一格式的问题。因此,亟需一种多医疗机构下的病例数据抽取方法及其相关设备,以解决跨区域多医疗机构间 ...
【技术保护点】
【技术特征摘要】
1.一种多医疗机构下的病例数据抽取方法,其特征在于,包括下述步骤:获取待抽取的N个医疗机构对象,其中,N为正整数;在所述N个医疗机构对象中抽取任一医疗机构对象作为目标医疗机构,并连接所述目标医疗机构的目标数据缓存库,其中,所述数据缓存库内存储了全量历史病例数据;从所述数据缓存库内获取样本病例数据,其中,所述样本病例数据为所述全量历史病例数据中被选择的若干条病例数据;将所述样本病例数据输入预构建的机器学习模型,并采用提示学习方式训练所述机器学习模型,得到训练好的目标机器学习模型;获取预先设置的待抽取的目标信息以及与所述目标信息对应的输出模板;根据所述训练好的机器学习模型抽取所述目标信息的提示模板;根据所述提示模板、所述输出模板和预设的UIE框架进行模型构建操作,得到所述目标医疗机构对应的信息抽取模型;当完成所述N个医疗机构对象的模型构建操作之后,得到所述N个医疗机构对象相对应的N个信息抽取模型;根据所述N个信息抽取模型分别对所述N个医疗机构对象相对应的数据缓存库进行数据抽取操作,得到数据抽取结果;将所述数据抽取结果输出至预设的目标接收端。2.根据权利要求1所述的多医疗机构下的病例数据抽取方法,其特征在于,在执行所述将所述样本病例数据输入预构建的机器学习模型,并采用提示学习方式训练所述机器学习模型,得到训练好的目标机器学习模型的步骤之前,所述方法还包括:提取出所述样本病例数据内每条历史病例数据中的患者信息、病灶信息、诊断信息、医师信息以及治疗信息,获取提取结果;根据所述提取结果,构建出患者信息子集、病灶信息子集、诊断信息子集、医师信息子集以及治疗信息子集;根据所述患者信息子集和预设的词频分析模型,获取到从所述目标信息中识别患者信息的标签词;同理,分别获取到从所述目标信息中识别病灶信息的标签词、从所述目标信息中识别诊断信息的标签词、从所述目标信息中识别医师信息的标签词、从所述目标信息中识别治疗信息的标签词;整理识别患者信息的标签词、识别病灶信息的标签词、识别诊断信息的标签词、识别医师信息的标签词和识别治疗信息的标签词,并构建标签词集。3.根据权利要求2所述的多医疗机构下的病例数据抽取方法,其特征在于,所述根据所述患者信息子集和预设的词频分析模型,获取到从所述目标信息中识别患者信息的标签词的步骤,具体包括:将所述患者信息子集输入到所述预设的词频分析模型内,其中,所述预设的词频分析模型为基于TF
‑
IDF算法的词频分析模型;对所述患者信息子集中每一条患者信息进行分词处理,获取每一条患者信息分别包含的分词处理结果;根据分词处理结果和所述TF
‑
IDF算法,计算每一条待分析数据中各个分词的TF
‑
IDF
值;按照TF
‑
IDF值从大到小的顺序对所述患者信息子集中所有分词进行排序,筛选出排名前N位的分词作为从所述目标信息中识别出患者信息的标签词,其中,N为正整数。4.根据权利要求3所述的多医疗机构下的病例数据抽取方法,其特征在于,所述根据分词处理结果和所述TF
‑
IDF算法,计算每一条待分析数据中各个分词的TF
‑
IDF值的步骤,具体包括:获取当前条待分析数据的分词处理结果;根据所述分词处理结果,统计当前分词在当前条待分析数据中出现的词频;统计所述患者信息子集中所有待分析数据的条数,以及统计包含当前分词的所有待分析数据的条数;根据所述患者信息子集中所有待分析数据的条数,以及包含当前分词的所有待分析数据的条数,计算当前分词的逆文档频率;根据所述词频和所述逆文档频率,进行乘法运算,获得所述当前分词的TF
‑
IDF值。5.根据权利要求3所述的多医疗机构下的病例数据抽取方法,其特征在于,所述整理识别患者信息的标签词、识别病灶信息的标签词、识别诊断信息的标签词、识别医师信息的标签词和识别治疗信息的标签词,并构建标签词集的步骤,具体包括:根据识别信息类别的不同,对不同信息类别的标签词分别设置不同的大类区别编号,其中,所述不同信息类别包括患者信息类别、病灶信息类别、诊断信息类别、医师信息类别以及治疗信息类别;对同一类别信息的不同标签词分别设置不同的小类区别编号,其中,所述同一类别信息的不同标签词指识别同一类别信息时排名前...
【专利技术属性】
技术研发人员:潘劲松,吴雪婧,
申请(专利权)人:中国平安财产保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。