基于大模型构建prompt自动标注医疗文本的方法、装置、设备及介质制造方法及图纸

技术编号：42411115 阅读：37 留言：0更新日期：2024-08-16 16:29

本发明专利技术属于医疗文本标注技术领域，具体提供一种基于大模型构建prompt自动标注医疗文本的方法、装置、设备及介质，所述方法包括：将医疗文本数据进行预处理生成句子样本；基于句子样本构建实体无区分类别Prompt模版，捕获医疗文本中的通用实体信息；基于捕获的通用实体信息，预设实体类型，构建实体区分类别Prompt模版，捕获医疗文本中的实体类型信息；基于捕获的实体类型信息，预设通用实体关系类型，构建实体关系无区分类别Prompt模版，捕获医疗文本中的实体关系通用信息；基于捕获的实体关系通用信息，预设实体关系类型，构建实体关系区分类别Prompt模版，捕获医疗文本中的实体关系类别信息。提高标注的效率。

全部详细技术资料下载

【技术实现步骤摘要】

所属的技术人员能够理解，基于大模型构建prompt自动标注医疗文本的方法各个方面可以实现为系统、方法或程序产品。因此，本公开的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。尽管通过参考附图并结合优选实施例的方式对本专利技术进行了详细描述，但本专利技术并不限于此。在不脱离本专利技术的精神和实质的前提下，本领域普通技术人员可以对本专利技术的实施例进行各种等效的修改或替换，而这些修改或替换都应在本专利技术的涵盖范围内/任何熟悉本的技术人员在本专利技术揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本专利技术的保护范围之内。

技术介绍

1、在医疗领域，大量的文本数据需要被准确地标记以提取有价值的信息，例如病历记录、医学文献和临床试验报告等。传统的文本标注方法依赖于专家的手工标记，这个过程耗时且成本高昂。尽管存在一些自动化的文本标注工具，但它们通常依赖于特定领域的规则或统计模型，难以适应复杂多变的医疗文本。

>2、近年来，随着预本文档来自技高网...

【技术保护点】

1.一种基于大模型构建prompt自动标注医疗文本的方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于大模型构建prompt自动标注医疗文本的方法，其特征在于，将医疗文本数据进行预处理生成句子样本的步骤之前包括：

3.根据权利要求2所述的基于大模型构建prompt自动标注医疗文本的方法，其特征在于，将文本数据进行预处理生成句子样本的步骤包括：

4.根据权利要求3所述的基于大模型构建prompt自动标注医疗文本的方法，其特征在于，基于句子样本构建实体无区分类别Prompt模版，捕获医疗文本中的通用实体信息的步骤包括：>

5.根据权利...

【技术特征摘要】

1.一种基于大模型构建prompt自动标注医疗文本的方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于大模型构建prompt自动标注医疗文本的方法，其特征在于，将医疗文本数据进行预处理生成句子样本的步骤之前包括：

3.根据权利要求2所述的基于大模型构建prompt自动标注医疗文本的方法，其特征在于，将文本数据进行预处理生成句子样本的步骤包括：

4.根据权利要求3所述的基于大模型构建prompt自动标注医疗文本的方法，其特征在于，基于句子样本构建实体无区分类别prompt模版，捕获医疗文本中的通用实体信息的步骤包括：

5.根据权利要求4所述的基于大模型构建prompt自动标注医疗文本的方法，其特征在于，基于捕获的通用实体信息，预设实体类型，构建实体区分类别prompt模版，捕获医疗文本中的实体类型信息的步骤包括：

6.根据权利要求5所述的基于大模型构建prompt自动标注医疗文本的方法，其特征在于，基于捕获的实体类型信息，预设通用实体关系类型，构建实体关系无区分类别prompt模版，捕获医疗文本中的实体关系通用信息的步...

【专利技术属性】
技术研发人员：李涛，王辉，郭浩宇，蔡卓人，马杰，金剑，
申请(专利权)人：北方健康医疗大数据科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人