【技术实现步骤摘要】
一种值域数据匹配方法、装置及相关产品
本申请涉及数据处理
,特别是涉及一种值域数据匹配方法、装置及相关产品。
技术介绍
近年来,随着医疗领域信息化产业化进程的不断推进,医疗数据的展现形式也发生了巨大的变化。这对于医院的医疗信息系统(HospitalInformationSystem,HIS)和国家卫生信息系统都产生了深刻的影响。为了对区域的疾病发病状况、疾病治疗方案等医疗领域相关信息进行有效收集、分析和运用,目前可以建立区域平台。医疗数据中包含大量的值域数据,其中有些值域数据的种类较少,数据组织简单,可称为小值域的值域数据,例如医保类别、患者性别等;另外还有一些值域数据的种类较少,数据组织复杂,可称为大值域的值域数据,例如手术名称、疾病名称等。区域平台对应的区域通常包括多个医院,每个医院分别建立数据库用以存储该医院的医疗数据,区域平台从这些数据库中获得数据并进行分析和应用。但是各个医院的数据库存储的值域数据可能存在不标准、不统一的问题。作为示例,医院A的数据库中对“喉切除术”的名称为“第一手术”,医院B ...
【技术保护点】
1.一种值域数据匹配方法,其特征在于,包括:/n获得待匹配值域数据;/n对所述待匹配值域数据中待匹配手术名称进行处理,获得待匹配特征向量组;/n利用数据匹配模型和所述待匹配特征向量组获得匹配结果;所述数据匹配模型为预先利用打标签的样本特征向量组训练后获得的;所述标签包括所述历史手术名称对应的国标手术名称的名称索引值,和所述国标手术名称在值域分类树的各层对应的节点索引值;所述值域分类树为依据人体或动物体的部位对国标手术名称进行分类的结构树。/n
【技术特征摘要】
1.一种值域数据匹配方法,其特征在于,包括:
获得待匹配值域数据;
对所述待匹配值域数据中待匹配手术名称进行处理,获得待匹配特征向量组;
利用数据匹配模型和所述待匹配特征向量组获得匹配结果;所述数据匹配模型为预先利用打标签的样本特征向量组训练后获得的;所述标签包括所述历史手术名称对应的国标手术名称的名称索引值,和所述国标手术名称在值域分类树的各层对应的节点索引值;所述值域分类树为依据人体或动物体的部位对国标手术名称进行分类的结构树。
2.根据权利要求1所述的方法,其特征在于,获得所述数据匹配模型,具体包括:
按照人体或动物体的部位对国际疾病分类标准中包括的多个国标手术名称进行分类,获得值域分类树;所述值域分类树中各层至少包括一个节点;
从医院信息系统HIS获得的所述历史手术名称,以及所述历史手术名称与国标手术名称的对应关系;
对所述历史手术名称进行处理,获得所述样本特征向量组;利用所述历史手术名称、所述对应关系以及所述值域分类树,获得所述标签;
利用带有所述标签的所述样本特征向量组对待训练模型进行训练,当预设结束条件满足时,停止训练并获得所述数据匹配模型。
3.根据权利要求2所述的方法,其特征在于,所述对所述历史手术名称进行处理,获得所述样本特征向量组,具体包括:
拆分所述历史手术名称,获得所述历史手术名称对应的m个维度的基本特征;利用所述m个维度的基本特征获得第k个维度的特征关系特征值wk,其中,所述k=1,2,…,m;
从医院信息系统HIS获得所述历史手术名称的科室信息和/或挂号信息,利用所述科室信息和/或挂号信息获得所述历史手术名称的类别向量;
利用m个维度的特征关系特征值w1,w2,…,wm和所述类别向量,获得所述样本特征向量组。
4.根据权利要求3所述的方法,其特征在于,所述利用所述m个维度的基本特征获得第k个维度的特征关系特征值wk,具体包括:
利用皮尔逊计算公式、斯皮尔曼计算公式或卡方检验的方法获得第k个维度的基本特征与其他各个维度的基本特征之间的相关度评分;
利用预设相关系数和所述相关度评分获得所述第k个维度的特征关系特征值wk。
5.根据权利要求3所述的方法,其特征在于,所述拆分所述历史手术名称,获得所述历史手术名称对应的m个维度的基本特征,具体包括:
拆分所述历史手术名称,获得所述历史手术名称的关键词、目标字、预设字窗口中所述目标字之前或之后的字、目标词、预设词窗口中所述目标词之前或之后的...
【专利技术属性】
技术研发人员:冯仓龙,
申请(专利权)人:东软集团股份有限公司,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。