【技术实现步骤摘要】
一种面向疾病和用药管理的实体链指方法及装置
[0001]本专利技术涉及计算机
,尤其涉及一种面向疾病和用药管理的实体链指方法、装置、电子设备及存储介质。
技术介绍
[0002]为了更好的让机器理解文本,机器常常需要识别文本中的实体,同时将文本中的实体与对应的知识库中的实体一一对应。知识库中的同名实体往往很多,需要进行实体链指(Entity Linking)工作。实体链指对许多自然语言处理和信息检索任务都能产生积极的助力作用。
[0003]目前,在医学健康领域,现有技术中有很多基于信息检索匹配的方法或传统命名实体识别方法对大量非结构化的医疗文本数据进行实体抽取的方式,但准确率较差。另外,对于实体对齐,现有技术一般为基于药学知识信息知识库或基于关键词的匹配方式,这种方法效率较低且对于医学知识图谱的维护成本较高。
技术实现思路
[0004]为解决上述问题,本专利技术提供一种面向疾病和用药管理的实体链指方法及装置。
[0005]本专利技术提供一种面向疾病和用药管理的实体链指方法,包括:
...
【技术保护点】
【技术特征摘要】
1.一种面向疾病和用药管理的实体链指方法,其特征在于,包括:获取目标文本;基于XLNET的命名实体识别模型识别所述目标文本中包括的至少一个目标实体,并确定各所述目标实体所属的实体类别;根据所述目标实体和所述目标实体所属的实体类别,确定各所述目标实体对应的至少一个候选实体;计算各所述目标实体与其对应的各候选实体的相似度,并根据各所述目标实体与其对应的各候选实体的相似度,确定所述至少一个目标实体的实体链指结果。2.根据权利要求1所述的面向疾病和用药管理的实体链指方法,其特征在于,根据所述目标实体和所述目标实体所属的实体类别,确定各所述目标实体对应的至少一个候选实体,包括:根据所述目标实体和所述目标实体所属的实体类别,将知识图谱中当前所述目标实体所属的实体类别下的全部实体作为候选实体。3.根据权利要求1所述的面向疾病和用药管理的实体链指方法,其特征在于,计算各所述目标实体与其对应的各候选实体的相似度,并根据各所述目标实体与其对应的各候选实体的相似度,确定所述至少一个目标实体的实体链指结果,包括:将各所述目标实体与其对应的各候选实体输入至实体相似度模型中,得到各所述目标实体与其对应的各候选实体的相似度;将各所述目标实体与相似度最高的候选实体相对齐,确定各所述目标实体的实体链指结果;其中,所述实体相似度模型由BERT子模型和词袋子模型组成。4.根据权利要求3所述的面向疾病和用药管理的实体链指方法,其特征在于,将各所述目标实体与其对应的各候选实体输入至实体相似度模型中,得到各所述目标实体与其对应的各候选实体的相似度,包括:将各所述目标实体与其对应的各候选实体分别输入至BERT子模型和词袋子模型中,得到由BERT子模型输出的各所述目标实体与其对应的各候选实体的第一相似度和词袋子模型输出的各所述目标实体与其对应的各候选实体的第二相似度;对所述第一相似度和所述第二相似度进行不同权重分配,并通过加权求和得到最终各所述目标实体与其对应的各候选实体的相似度。5.一种面向疾病和用药管理的实体链指装置,其特征在于,包括:获取模...
【专利技术属性】
技术研发人员:卢晓阳,羊红玉,洪东升,马葵芬,高飞,孙名扬,王则远,
申请(专利权)人:北京诺道认知医学科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。