【技术实现步骤摘要】
基于黎曼空间的词嵌入方法和装置、介质及设备
本公开涉及自然语言处理
,具体而言,涉及一种基于黎曼空间的词嵌入方法和装置、计算机可读介质和电子设备。
技术介绍
随着医疗信息化建设的普及,临床电子病历成为关注的焦点,激起了人们对于医疗信息检索和信息提取的浓厚兴趣。信息检索和提取可以极大的帮助人们处理那些浩瀚庞大的电子病历数据,而它们的应用依赖于术语标识(TermIdentification),以通过计算机访问存储在电子病历中的信息。此处的术语(Term)是用于临床知识交流的手段,因为他们可以用于标识该领域的概念。例如:手术名字、诊断名字、药品名称、检验名称、实验名称和剖解部位的名字等等。从而,准确的标识临床交流中术语(Term),才有利于计算机准确理解相关的临床电子病历。一般采用词嵌入技术标识临床交流中术语。词嵌入(WordEmbedding),也称词的分布式表示(Distributedwordrepresentations),是一种稠密的低维度的词表示,每一个维度表示词的潜在特征,维度的值为浮点数。相关技术提供的 ...
【技术保护点】
1.一种基于黎曼空间的词嵌入方法,其特征在于,所述方法包括:/n确定对关于医疗文本所构成的黎曼空间的曲率修正因子;/n获取医疗文本实体,并将所述曲率修正因子的属性值作为所述医疗文本实体的标签;/n将包含所述标签的医疗文本实体输入至训练后的词嵌入模型,以通过所述词嵌入模型中带有调整参数的神经网络得到所述医疗文本实体对应的关注度;/n基于所述关注度确定目标医疗实体,并通过所述词嵌入模型实现所述目标医疗文本实体的词嵌入。/n
【技术特征摘要】
1.一种基于黎曼空间的词嵌入方法,其特征在于,所述方法包括:
确定对关于医疗文本所构成的黎曼空间的曲率修正因子;
获取医疗文本实体,并将所述曲率修正因子的属性值作为所述医疗文本实体的标签;
将包含所述标签的医疗文本实体输入至训练后的词嵌入模型,以通过所述词嵌入模型中带有调整参数的神经网络得到所述医疗文本实体对应的关注度;
基于所述关注度确定目标医疗实体,并通过所述词嵌入模型实现所述目标医疗文本实体的词嵌入。
2.根据权利要求1所述的基于黎曼空间的词嵌入方法,其特征在于,所述曲率修正因子至少包括以下信息中的一种:医生生物钟、医生对病历的处理速度、疾病流行程度和疾病的类型。
3.根据权利要求1所述的基于黎曼空间的词嵌入方法,其特征在于,所述获取医疗文本实体,包括:
根据电子病历中的结构化文本、半结构化文本和/或自由文本确定医疗文本实体。
4.根据权利要求1所述的基于黎曼空间的词嵌入方法,其特征在于,所述通过所述词嵌入模型中带有调整参数的神经网络得到所述医疗文本实体对应的关注度,包括:
所述带有调整参数的神经网络根据所述医疗文本实体的标签确定所述医疗文本实体对应的关注度;
其中,所述调整参数用于表征所述曲率修正因子对于所述黎曼空间曲率的影响程度。
5.根据权利要求4所述的基于黎曼空间的词嵌入方法,其特征在于,所述基于所述关注度确定目标医疗实体,包括:
在所述黎曼空间曲率大于预设阈值时,修改纳排条件,以从所述医疗文本实体中确定所述目标医疗文本实体。
6.根据权利要求4所述的基于黎曼空间的词...
【专利技术属性】
技术研发人员:闫峻,薛恒钢,
申请(专利权)人:医渡云北京技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。