信息提取方法、装置、设备、存储介质和程序产品制造方法及图纸

技术编号:43682403 阅读:30 留言:0更新日期:2024-12-18 21:03
本申请公开了一种信息提取方法、装置、设备、存储介质和程序产品,涉及信息处理技术领域,包括:在第一类任务指令集中选择目标任务指令;每个第一类任务指令指示:提取由至少一个层次的信息构成的结构化信息;不同的第一类任务指令指示提取的结构化信息包含的信息层次数不同;将目标任务指令以及影像报告输入预先训练好的信息提取模型,得到从影像报告中提取的由一个或多个层次的信息构成的结构化信息;用于对信息提取模型进行训练的训练样本集中的每个训练样本均至少包括影像报告样本和第一类任务指令;训练样本的标签至少包括从影像报告样本中提取的由至少一个层次的信息构成的结构化信息,实现了不同层次的结构化信息的自动化提取。

【技术实现步骤摘要】

本申请涉及信息处理,尤其涉及一种信息提取方法、装置、设备、存储介质和程序产品


技术介绍

1、作为临床医学数据的重要组成部分之一,影像报告对于临床分析、决策和诊断有着重要意义。在现有的临床数据库中,影像报告以原始文本的非结构化形式存储,并且受限于医生书写习惯的不同,其中的信息往往呈现碎片化、半规范化的形式,为数据挖掘和数据分析带来了挑战。此外,在智慧医疗应用中,复杂的非结构化原始影像报告文本也给人工智能模型的学习和理解带来了困难,容易导致模型训练不稳定,难以获取报告中的有价值信息。

2、为了方便临床的决策和获取高质量的模型语料数据,通过自动化手段对影像报告进行结构化的信息提取具有及其重要的意义。


技术实现思路

1、鉴于上述问题,本申请提供了一种信息提取方法、装置、设备、存储介质和程序产品,以实现自动化的信息提取。具体方案如下:

2、本申请第一方面提供一种信息提取方法,所述方法包括:

3、在第一类任务指令集中选择目标任务指令;所述第一类任务指令集中的每个第一类任务指令指示:提本文档来自技高网...

【技术保护点】

1.一种信息提取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述在第一类任务指令集中选择目标任务指令,包括:

3.根据权利要求1所述的方法,其特征在于,每个训练样本还包括第二类任务指令,第三类任务指令和第四类任务指令这三类任务指令中的至少一类任务指令;不同类的任务指令指示不同的任务;

4.根据权利要求3所述的方法,其特征在于,所述信息提取模型通过如下方式训练得到:

5.根据权利要求3所述的方法,其特征在于,在训练的每一轮迭代中:

6.根据权利要求3所述的方法,其特征在于,在训练的每一轮迭代中:...

【技术特征摘要】

1.一种信息提取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述在第一类任务指令集中选择目标任务指令,包括:

3.根据权利要求1所述的方法,其特征在于,每个训练样本还包括第二类任务指令,第三类任务指令和第四类任务指令这三类任务指令中的至少一类任务指令;不同类的任务指令指示不同的任务;

4.根据权利要求3所述的方法,其特征在于,所述信息提取模型通过如下方式训练得到:

5.根据权利要求3所述的方法,其特征在于,在训练的每一轮迭代中:

6.根据权利要求3所述的方法,其特征在于,在...

【专利技术属性】
技术研发人员:黄飞跃朱立峰柏志安徐兴坤徐勤伟
申请(专利权)人:上海交通大学医学院附属瑞金医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1