【技术实现步骤摘要】
本专利技术涉及自然语言处理,尤其涉及一种针对药学信息文本的实体识别方法和装置。
技术介绍
1、实体识别又称为实体抽取,是为了从非结构化的文本中获取特定的信息元素,通常是一段文本中带有某些特征的片段(未必连续)。相关技术中,实体识别方法主要分为基于模板规则/统计的传统方法与基于深度学习的方法。
2、而针对药学信息文本(如药品说明书),作为医疗领域的实体识别任务,由于其实体有其特殊性,常常面临十分复杂的实体情况,如超长实体、嵌套实体、共享前/后缀等。相关技术中针对药学信息文本进行实体识别处理时,存在实体识别效率低、识别准确率低,耗费较多人力资源,实体识别的自动化程度较低,导致用户体验较差。
技术实现思路
1、有鉴于此,本专利技术实施例提供一种实体识别方法和装置,能够基于实体词库和实体识别模板对药学信息文本进行实体识别,提高了实体识别的准确率和效率,提高了实体识别的自动化程度,提升了用户体验。
2、为实现上述目的,根据本专利技术实施例的一个方面,提供了一种实体识别方法,包
3本文档来自技高网...
【技术保护点】
1.一种实体识别方法,其特征在于,包括:
2.根据权利要求1所述的实体识别方法,其特征在于,在所述根据所述第一实体和所述实体类型,从实体识别模板集合中确定目标实体识别模板的步骤之前,所述方法还包括:
3.根据权利要求2所述的实体识别方法,其特征在于,所述根据所述第一实体和所述实体类型,从实体识别模板集合中确定目标实体识别模板;根据所述目标实体识别模板对所述药学信息文本进行识别处理,得到目标实体的步骤,包括:
4.根据权利要求2所述的实体识别方法,其特征在于,所述方法还包括:
5.根据权利要求1所述的实体识别方法,其特征在
...【技术特征摘要】
1.一种实体识别方法,其特征在于,包括:
2.根据权利要求1所述的实体识别方法,其特征在于,在所述根据所述第一实体和所述实体类型,从实体识别模板集合中确定目标实体识别模板的步骤之前,所述方法还包括:
3.根据权利要求2所述的实体识别方法,其特征在于,所述根据所述第一实体和所述实体类型,从实体识别模板集合中确定目标实体识别模板;根据所述目标实体识别模板对所述药学信息文本进行识别处理,得到目标实体的步骤,包括:
4.根据权利要求2所述的实体识别方法,其特征在于,所述方法还包括:
5.根据权利要求1所述的实体识别方法...
【专利技术属性】
技术研发人员:张亚,杨帅,吴元清,周谦,
申请(专利权)人:北京京东拓先科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。