【技术实现步骤摘要】
本专利技术涉及数据处理,尤其是涉及一种数据结构化方法、系统及电子设备。
技术介绍
1、电子病历(electronic medical record,emr)是一种医疗机构或个人使用电子方式记录、存储和管理患者的医疗信息数据形式。相比传统的纸质病历,电子病历采用数字化的形式,将患者的病情、诊断、治疗方案等信息以结构化的方式进行保存和管理。
2、电子病历的使用过程中需要将其进行结构化处理,以生成特定的数据结构进行使用。现有技术中主要通过自然语言处理技术,对电子病历对应的文本数据进行分析和处理,主要通过文本预处理、信息提取、实体标注与编码、结构化标识、数据验证与校证等关键步骤完成,最终将其转化为特定结构化的数据形式。但对于电子病历的自然语言处理过程中,存在较多的多义词,即一个词语或短语存在多种含义,从而导致自然语言处理产生歧义,影响电子病历的结构化效果。
技术实现思路
1、有鉴于此,本专利技术的目的在于提供一种数据结构化方法、系统及电子设备,该方法充分利用电子病历数据中的实体词汇,通
...【技术保护点】
1.一种数据结构化方法,其特征在于,所述方法包括:
2.根据权利要求1所述的数据结构化方法,其特征在于,所述基于电子病历数据确定的预处理数据生成第一结构化参数,并利用所述第一结构化参数确定所述预处理数据对应的文本数据的步骤,包括:
3.根据权利要求1所述的数据结构化方法,其特征在于,所述提取所述文本数据中包含的多个实体词汇,并根据所述实体词汇的分类结果确定所述实体词汇之间的关系信息的步骤,包括:
4.根据权利要求3所述的数据结构化方法,其特征在于,所述根据所述分类结果对所述实体词汇进行语义分析,并利用语义分析结果确定所述实体词汇之间
...【技术特征摘要】
1.一种数据结构化方法,其特征在于,所述方法包括:
2.根据权利要求1所述的数据结构化方法,其特征在于,所述基于电子病历数据确定的预处理数据生成第一结构化参数,并利用所述第一结构化参数确定所述预处理数据对应的文本数据的步骤,包括:
3.根据权利要求1所述的数据结构化方法,其特征在于,所述提取所述文本数据中包含的多个实体词汇,并根据所述实体词汇的分类结果确定所述实体词汇之间的关系信息的步骤,包括:
4.根据权利要求3所述的数据结构化方法,其特征在于,所述根据所述分类结果对所述实体词汇进行语义分析,并利用语义分析结果确定所述实体词汇之间的关系信息的步骤,包括:
5.根据权利要求1所述的数据结构化方法,其特征在于,所述利用所述关系信息生成所述实体词汇对应的实体语句,并获取所述实体语句的语义信息的步骤,包括:
6.根...
【专利技术属性】
技术研发人员:王杰,王剑斌,周炜,赵大平,黄智勇,黄克华,郁翰钟,姚俊,周国兵,江媛媛,
申请(专利权)人:卫宁健康科技集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。