电子病历的相似度确定方法、装置、设备和存储介质制造方法及图纸

技术编号:21365418 阅读:29 留言:0更新日期:2019-06-15 10:12
本发明专利技术涉及一种电子病历的相似度确定方法、装置、设备和存储介质,将多个电子病历的非结构化数据转化成向量,并计算各个电子病历的向量之间的第一相似度,获取各个电子病历的结构化数据的第二相似度,然后根据第一相似度和第二相似度确定各个电子病历之间的相似度,该方案结合电子病历的结构化数据和非结构化数据的相似度来计算各个电子病历之间的相似度,提高了计算电子病历相似度的准确性,还有利于准确评估与各个电子病历相对应的患者之间的相似程度,为进一步发现病人群落和实现个性化诊疗提供数据基础。

Method, Device, Equipment and Storage Medium for Determining the Similarity of Electronic Medical Records

The invention relates to a method, device, device and storage medium for determining the similarity of electronic medical records. The unstructured data of multiple electronic medical records are transformed into vectors, and the first similarity among vectors of each electronic medical record is calculated to obtain the second similarity of structured data of each electronic medical record, and then the electronic medical records are determined according to the first similarity and the second similarity. The scheme combines the similarity between structured data and unstructured data of electronic medical records to calculate the similarity between electronic medical records, improves the accuracy of calculating the similarity of electronic medical records, and helps to accurately evaluate the similarity between patients corresponding to each electronic medical record, so as to provide numbers for further discovering patient community and realizing personalized diagnosis and treatment. According to the basis.

【技术实现步骤摘要】
电子病历的相似度确定方法、装置、设备和存储介质
本专利技术涉及数据处理
,特别是涉及一种电子病历的相似度确定方法、电子病历的相似度确定装置、计算机设备和计算机可读存储介质。
技术介绍
电子病历是用如个人电脑、健康卡等电子设备对患者的病历信息进行保存、管理、传输和重现的数字化医疗记录,可以用于取代手写纸张病历,电子病历记录的内容可以包括纸张病历的所有信息,比如现病史中关于病程进展及诊疗过程的描述、病程记录中关于患者病情变化的描述、出院小结中关于治疗经过的描述等等。基于电子病历记录的信息可以评估不同电子病历之间的相似程度,而对电子病历之间相似程度的准确评估有助于准确量度各个病人之间的相似性,这对于进一步发现病人群落、实现个性化诊疗作基础具有重要的现实意义。传统技术提供的计算电子病历相似度的方式,无法充分利用电子病历中的病例信息对各个电子病历之间的相似度进行计算,相似度比较的维度单一比较,导致计算电子病历相似度的准确性较低。
技术实现思路
基于此,有必要针对传统技术计算电子病历相似度的准确性较低的技术问题,提供一种电子病历的相似度确定方法、电子病历的相似度确定装置、计算机设备和计算机可读存储介质。一种电子病历的相似度确定方法,包括步骤:将多个电子病历的非结构化数据转化为向量;计算各个所述电子病历的所述向量的第一相似度;获取第二相似度;所述第二相似度为各个所述电子病历的结构化数据的相似度;根据所述第一相似度和第二相似度确定各个所述电子病历的相似度。一种电子病历的相似度确定装置,包括:第一获取模块,用于获取多个电子病历的非结构化数据;转化模块,用于将所述非结构化数据转化为向量;计算模块,用于计算各个所述电子病历的所述向量的第一相似度;第二获取模块,用于获取第二相似度;所述第二相似度为各个所述电子病历的结构化数据的相似度;确定模块,用于根据所述第一相似度和第二相似度确定各个所述电子病历的相似度。一种计算机设备,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如下步骤:将多个电子病历的非结构化数据转化为向量;计算各个所述电子病历的所述向量的第一相似度;获取第二相似度;所述第二相似度为各个所述电子病历的结构化数据的相似度;根据所述第一相似度和第二相似度确定各个所述电子病历的相似度。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:将多个电子病历的非结构化数据转化为向量;计算各个所述电子病历的所述向量的第一相似度;获取第二相似度;所述第二相似度为各个所述电子病历的结构化数据的相似度;根据所述第一相似度和第二相似度确定各个所述电子病历的相似度。上述电子病历的相似度确定方法、装置、设备和存储介质,将多个电子病历的非结构化数据转化成向量,并计算各个电子病历的向量之间的第一相似度,获取各个电子病历的结构化数据的第二相似度,然后根据第一相似度和第二相似度确定各个电子病历之间的相似度,该方案结合电子病历的结构化数据和非结构化数据的相似度来计算各个电子病历之间的相似度,提高了计算电子病历相似度的准确性,还有利于准确评估与各个电子病历相对应的患者之间的相似程度,为进一步发现病人群落和实现个性化诊疗提供数据基础。附图说明图1为一个实施例中电子病历的相似度确定方法的应用场景图;图2为一个实施例中电子病历的相似度确定方法的流程示意图;图3为另一个实施例中电子病历的相似度确定方法的流程示意图;图4为一个实施例中电子病历的相似度确定装置的结构框图;图5为一个实施例中计算机设备的内部结构图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。需要说明的是,本专利技术实施例所涉及的术语“第一\第二”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二”区分的对象在适当情况下可以互换,以使这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。本专利技术提供的电子病历的相似度确定方法,可以应用于如图1所示的应用场景中,图1为一个实施例中电子病历的相似度确定方法的应用场景图,应用场景可以包括终端100和服务器200,终端100可以通过网络与服务器200进行通信连接。其中,终端100可以用于存储如病人、患者等用户的电子病历,终端100的数量可以是多个,各个终端可以分别与服务器200进行通信,将存储的电子病历发送到服务器200当中,服务器200可以用于确定各个电子病历之间的相似度。具体的,服务器200可以将接收的多个电子病历(如电子病历A、电子病历B和电子病历C等)中记录的非结构化数据转化为向量,计算各个电子病历的向量之间的第一相似度,还获取各个电子病历的结构化数据之间的第二相似度,最后根据第一相似度和第二相似度确定各个电子病历的相似度,这样能够结合电子病历的结构化数据和非结构化数据的相似度来计算各个电子病历之间的相似度,以提高计算电子病历相似度的准确性,而且由于各电子病历记录的是相应的病人、患者等用户的病例信息,提高电子病历相似度的计算准确性有利于准确度量相应的病人、患者等用户之间的相似性,为进一步发现病人群落、实现个性化诊疗提供数据基础,具有重要的现实意义。其中,终端100可以但不限于是各种个人计算机、笔记本电脑和平板电脑,服务器200可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一个实施例中,提供了一种电子病历的相似度确定方法,参考图2,图2为一个实施例中电子病历的相似度确定方法的流程示意图,以该方法应用于图1中的服务器200为例进行说明,该电子病历的相似度确定方法可以包括以下步骤:步骤S101,将多个电子病历的非结构化数据转化为向量。电子病历中包含着大量的数据以承载患者、病人等用户的病历信息,可以将数据划分为非结构化数据和结构化数据。在计算各个电子病历之间的相似度时,如果单纯结构化数据来进行电子病历的相似度比较,可能会漏掉大量重要的信息。例如,现病史中关于病程进展及诊疗过程的描述、病程记录中关于患者病情变化的描述、出院小结中关于治疗经过的描述等信息,这些信息不能转换成结构化数据,但是对衡量患者相似度又有重要的意义。这些信息一般以非结构化数据的形式来表示,因此需要综合利用结构化数据和非结构化数据来衡量各个电子病历之间的相似度。而非结构化数据主要以文本形式表示,而基于文本形式表示的数据难以直接用于相似度计算。所以本步骤将非结构化数据转化为向量进行表示,然后在后续步骤当中利用向量之间的相似度来表示非结构化文本之间的相似度。步骤S102,计算各个电子病历的向量的第一相似度。本步骤主要是计算各个电子病历的向量之间的相似度,该各个电子病历的向量之间的相似度即为第一相似度,由于电子病历的非结构化数据采用向量形式进行表示,因此第一相似度可以对应于各个电子病历的非结构化数据之间的相似度,而由于非结构化数据实际上包含着患者的重要病历信息,所以该第一相似度是作为衡量各个电子病历之间的相似度的重要参考依据。其中,量度各向量之间的相似度可以采用如计算向量夹角余本文档来自技高网...

【技术保护点】
1.一种电子病历的相似度确定方法,其特征在于,包括步骤:将多个电子病历的非结构化数据转化为向量;计算各个所述电子病历的所述向量的第一相似度;获取第二相似度;所述第二相似度为各个所述电子病历的结构化数据的相似度;根据所述第一相似度和第二相似度确定各个所述电子病历的相似度。

【技术特征摘要】
1.一种电子病历的相似度确定方法,其特征在于,包括步骤:将多个电子病历的非结构化数据转化为向量;计算各个所述电子病历的所述向量的第一相似度;获取第二相似度;所述第二相似度为各个所述电子病历的结构化数据的相似度;根据所述第一相似度和第二相似度确定各个所述电子病历的相似度。2.根据权利要求1所述的电子病历的相似度确定方法,其特征在于,所述将多个电子病历的非结构化数据转化为向量的步骤包括:确定非结构化数据的第一特征维度;按照所述第一特征维度进行要点分层,得到所述第一特征维度的多个要点;将与所述多个要点相对应的非结构化数据转化为向量。3.根据权利要求2所述的电子病历的相似度确定方法,其特征在于,所述将与所述多个要点相对应的非结构化数据转化为向量的步骤包括:将与所述多个要点相对应的非结构化数据划分为多个子句;通过深度自编码器获取与各个所述子句相匹配的子向量;将所述子向量进行求和得到所述向量。4.根据权利要求1至3任一项所述的电子病历的相似度确定方法,其特征在于,所述计算各个所述电子病历的所述向量的第一相似度的步骤包括:计算各个所述电子病历的所述向量的余弦相似度;根据所述余弦相似度确定所述第一相似度。5.根据权利要求1所述的电子病历的相似度确定方法,其特征在于,所述获取第二相似度的步骤包括:确定结构化数据的第二特征维度;从所述结构化数据中提取所述第二特征维度下的子结构化数据;获取与所述第二特征维度相对应的权重值;...

【专利技术属性】
技术研发人员:李菁许孟可
申请(专利权)人:广州天鹏计算机科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1