The invention relates to a method, device, device and storage medium for determining the similarity of electronic medical records. The unstructured data of multiple electronic medical records are transformed into vectors, and the first similarity among vectors of each electronic medical record is calculated to obtain the second similarity of structured data of each electronic medical record, and then the electronic medical records are determined according to the first similarity and the second similarity. The scheme combines the similarity between structured data and unstructured data of electronic medical records to calculate the similarity between electronic medical records, improves the accuracy of calculating the similarity of electronic medical records, and helps to accurately evaluate the similarity between patients corresponding to each electronic medical record, so as to provide numbers for further discovering patient community and realizing personalized diagnosis and treatment. According to the basis.
【技术实现步骤摘要】
电子病历的相似度确定方法、装置、设备和存储介质
本专利技术涉及数据处理
,特别是涉及一种电子病历的相似度确定方法、电子病历的相似度确定装置、计算机设备和计算机可读存储介质。
技术介绍
电子病历是用如个人电脑、健康卡等电子设备对患者的病历信息进行保存、管理、传输和重现的数字化医疗记录,可以用于取代手写纸张病历,电子病历记录的内容可以包括纸张病历的所有信息,比如现病史中关于病程进展及诊疗过程的描述、病程记录中关于患者病情变化的描述、出院小结中关于治疗经过的描述等等。基于电子病历记录的信息可以评估不同电子病历之间的相似程度,而对电子病历之间相似程度的准确评估有助于准确量度各个病人之间的相似性,这对于进一步发现病人群落、实现个性化诊疗作基础具有重要的现实意义。传统技术提供的计算电子病历相似度的方式,无法充分利用电子病历中的病例信息对各个电子病历之间的相似度进行计算,相似度比较的维度单一比较,导致计算电子病历相似度的准确性较低。
技术实现思路
基于此,有必要针对传统技术计算电子病历相似度的准确性较低的技术问题,提供一种电子病历的相似度确定方法、电子病历的相似度确定装置、计算机设备和计算机可读存储介质。一种电子病历的相似度确定方法,包括步骤:将多个电子病历的非结构化数据转化为向量;计算各个所述电子病历的所述向量的第一相似度;获取第二相似度;所述第二相似度为各个所述电子病历的结构化数据的相似度;根据所述第一相似度和第二相似度确定各个所述电子病历的相似度。一种电子病历的相似度确定装置,包括:第一获取模块,用于获取多个电子病历的非结构化数据;转化模块,用于将所述非结构化数 ...
【技术保护点】
1.一种电子病历的相似度确定方法,其特征在于,包括步骤:将多个电子病历的非结构化数据转化为向量;计算各个所述电子病历的所述向量的第一相似度;获取第二相似度;所述第二相似度为各个所述电子病历的结构化数据的相似度;根据所述第一相似度和第二相似度确定各个所述电子病历的相似度。
【技术特征摘要】
1.一种电子病历的相似度确定方法,其特征在于,包括步骤:将多个电子病历的非结构化数据转化为向量;计算各个所述电子病历的所述向量的第一相似度;获取第二相似度;所述第二相似度为各个所述电子病历的结构化数据的相似度;根据所述第一相似度和第二相似度确定各个所述电子病历的相似度。2.根据权利要求1所述的电子病历的相似度确定方法,其特征在于,所述将多个电子病历的非结构化数据转化为向量的步骤包括:确定非结构化数据的第一特征维度;按照所述第一特征维度进行要点分层,得到所述第一特征维度的多个要点;将与所述多个要点相对应的非结构化数据转化为向量。3.根据权利要求2所述的电子病历的相似度确定方法,其特征在于,所述将与所述多个要点相对应的非结构化数据转化为向量的步骤包括:将与所述多个要点相对应的非结构化数据划分为多个子句;通过深度自编码器获取与各个所述子句相匹配的子向量;将所述子向量进行求和得到所述向量。4.根据权利要求1至3任一项所述的电子病历的相似度确定方法,其特征在于,所述计算各个所述电子病历的所述向量的第一相似度的步骤包括:计算各个所述电子病历的所述向量的余弦相似度;根据所述余弦相似度确定所述第一相似度。5.根据权利要求1所述的电子病历的相似度确定方法,其特征在于,所述获取第二相似度的步骤包括:确定结构化数据的第二特征维度;从所述结构化数据中提取所述第二特征维度下的子结构化数据;获取与所述第二特征维度相对应的权重值;...
【专利技术属性】
技术研发人员:李菁,许孟可,
申请(专利权)人:广州天鹏计算机科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。