命名实体识别方法、装置、设备和计算机可读存储介质制造方法及图纸

技术编号:41570542 阅读:18 留言:0更新日期:2024-06-06 23:50
提供了一种命名实体识别方法、装置、设备和计算机可读存储介质。该命名实体识别方法包括:使用输入单元接收包括一个或多个命名实体的待识别文本;使用编码器中的大语言模型LLM对待识别文本进行嵌入式处理,以提取对应的特征向量序列;通过编码器中的双向门控循环单元GRU模型处理特征向量序列,以使用双向GRU模型中的前向GRU组件捕获待识别文本的前向上下文信息,并且使用双向GRU模型中的后向GRU组件捕获待识别文本的后向上下文信息,前向上下文信息或后向上下文信息包括待识别文本中的词元在时间上的短期依赖关系和长期依赖关系;以及使用输出单元基于捕获的前向上下文信息和后向上下文信息标注待识别文本中的一个或多个命名实体。

【技术实现步骤摘要】

本公开涉及文本处理领域,特别涉及一种基于大语言模型的命名实体识别方法、装置、设备和计算机可读存储介质


技术介绍

1、在自然语言处理中,命名实体识别(ner)任务扮演着至关重要的角色。它不仅涉及到识别文本中的关键信息,而且还要求精确地确定这些实体在文本中的具体位置。例如,在医疗文本处理领域,如何准确地识别和界定医学病历文本中的各类实体(例如,药物、疾病和症状)以及这些实体在病历文本中的准确位置具有重大意义。

2、然而,现有的ner方法在这方面面临着显著的挑战。

3、传统的ner方法,例如结合条件随机场(crf)的基于预训练bert模型方案,在医疗文本分析中已经取得了一定的成就。这些方法能够在一定程度上准确地识别文本中存在的实体,并确定这些实体在文本中的具体位置。然而,这些传统方法的主要挑战在于它们对多样性训练数据的依赖。在处理特定于医疗领域的复杂文本时,尤其是在面对多医院、多病种的数据时,这种对标注数据多样性的依赖限制了它们的泛化能力和应用范围。

4、大语言模型,如gpt系列的模型,在文本生成和理解方面展示了其卓越能力。本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的命名实体识别方法,包括:

2.如权利要求1所述的命名实体识别方法,还包括:

3.如权利要求2所述的命名实体识别方法,还包括:

4.如权利要求1至3中任一项所述的命名实体识别方法,还包括:

5.如权利要求1至3中任一项所述的命名实体识别方法,其中,所述LLM是GPT模型或BERT模型。

6.如权利要求1至3中任一项所述的命名实体识别方法,其中,所述待识别文本是与疾病相关联的病历文本。

7.如权利要求1至3中任一项所述的命名实体识别方法,还包括:

8.如权利要求7所述的命名实体识别方法...

【技术特征摘要】

1.一种基于大语言模型的命名实体识别方法,包括:

2.如权利要求1所述的命名实体识别方法,还包括:

3.如权利要求2所述的命名实体识别方法,还包括:

4.如权利要求1至3中任一项所述的命名实体识别方法,还包括:

5.如权利要求1至3中任一项所述的命名实体识别方法,其中,所述llm是gpt模型或bert模型。

6.如权利要求1至3中任一项所述的命名实体识别方法,其中,所述待识别文本是与疾病相关联的病历文本。

7.如权利要求1至3中任一项所述的命名实体识别方法,还包括:

8.如权利要求7所述的命名实体识别方法,其中,对所述命名实体识别装置进行预训练包括:

9.如权利要求7所述的命名实体识别方法,其中,对所述命名实体识别装置进行微调包括:

10.如权利要求7所述的命名实体识别方法,其中,

11.如权利要求9所述的命名实体识别...

【专利技术属性】
技术研发人员:刘晓华刘泽恩张程剀左赛陈小梅
申请(专利权)人:北京壹永科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1