【技术实现步骤摘要】
本公开涉及文本处理领域,特别涉及一种基于大语言模型的命名实体识别方法、装置、设备和计算机可读存储介质。
技术介绍
1、在自然语言处理中,命名实体识别(ner)任务扮演着至关重要的角色。它不仅涉及到识别文本中的关键信息,而且还要求精确地确定这些实体在文本中的具体位置。例如,在医疗文本处理领域,如何准确地识别和界定医学病历文本中的各类实体(例如,药物、疾病和症状)以及这些实体在病历文本中的准确位置具有重大意义。
2、然而,现有的ner方法在这方面面临着显著的挑战。
3、传统的ner方法,例如结合条件随机场(crf)的基于预训练bert模型方案,在医疗文本分析中已经取得了一定的成就。这些方法能够在一定程度上准确地识别文本中存在的实体,并确定这些实体在文本中的具体位置。然而,这些传统方法的主要挑战在于它们对多样性训练数据的依赖。在处理特定于医疗领域的复杂文本时,尤其是在面对多医院、多病种的数据时,这种对标注数据多样性的依赖限制了它们的泛化能力和应用范围。
4、大语言模型,如gpt系列的模型,在文本生成和理解方
...【技术保护点】
1.一种基于大语言模型的命名实体识别方法,包括:
2.如权利要求1所述的命名实体识别方法,还包括:
3.如权利要求2所述的命名实体识别方法,还包括:
4.如权利要求1至3中任一项所述的命名实体识别方法,还包括:
5.如权利要求1至3中任一项所述的命名实体识别方法,其中,所述LLM是GPT模型或BERT模型。
6.如权利要求1至3中任一项所述的命名实体识别方法,其中,所述待识别文本是与疾病相关联的病历文本。
7.如权利要求1至3中任一项所述的命名实体识别方法,还包括:
8.如权利要求7所
...【技术特征摘要】
1.一种基于大语言模型的命名实体识别方法,包括:
2.如权利要求1所述的命名实体识别方法,还包括:
3.如权利要求2所述的命名实体识别方法,还包括:
4.如权利要求1至3中任一项所述的命名实体识别方法,还包括:
5.如权利要求1至3中任一项所述的命名实体识别方法,其中,所述llm是gpt模型或bert模型。
6.如权利要求1至3中任一项所述的命名实体识别方法,其中,所述待识别文本是与疾病相关联的病历文本。
7.如权利要求1至3中任一项所述的命名实体识别方法,还包括:
8.如权利要求7所述的命名实体识别方法,其中,对所述命名实体识别装置进行预训练包括:
9.如权利要求7所述的命名实体识别方法,其中,对所述命名实体识别装置进行微调包括:
10.如权利要求7所述的命名实体识别方法,其中,
11.如权利要求9所述的命名实体识别...
【专利技术属性】
技术研发人员:刘晓华,刘泽恩,张程剀,左赛,陈小梅,
申请(专利权)人:北京壹永科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。