一种病人姓名模糊语义查询的方法技术

技术编号:10574575 阅读:167 留言:0更新日期:2014-10-29 09:38
本发明专利技术提供一种病人姓名模糊语义查询的方法,包括:(1)为拼音字母设置对应的整型常量权值;(2)根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常量权值和;(3)将所述权值和进行向右移位操作,建立所述病人相对应的姓索引和名索引;(4)将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询,若匹配,则查询结束;若不匹配,则根据所述步骤(2)和步骤(3)建立所述待匹配病人的姓索引和名索引,查询结束。本发明专利技术通过建立权值表和索引模型,不仅查询速度快、匹配性强,而且能有效地屏蔽了发音不准、口音、位置和大小写等因素。

【技术实现步骤摘要】

本专利技术涉及一种病人姓名查询的方法,尤其涉及一种对DICOM影像服务器中病人姓名模糊语义查询的方法
技术介绍
对于DICOM影像生成前的病人姓名登录,常见的场景有:(1)病人在纸上写上或者说出自己中文姓名;(2)医院预约登记人员录入原始姓名的中文汉字或者拼音;(3)医院预约登记人员根据录入系统反馈结果,或者自行判断增加内容,比如BB(表示婴儿)。以上场景都存在一定的问题,场景(1)由于病人口音,录入人员理解偏差,可能录入错误;场景(2)由于影像设备的中文汉字支持功能弱,必须用拼音做病人姓名,中文汉字到拼音的转换过程可能会出现差错;场景(3)增加的内容会有差异。而在实际医用环境中,病人很多,要求DICOM影像服务器操作人员在较短时间内,一次查询找到相近的目标病人记录供选择确认。DICOM3.0规范要求的常用查询检索匹配有:单值匹配、唯一标识符列表匹配、通用匹配、通配符匹配、范围匹配和序列匹配。当病人、检查、序列和图像等信息确定时,查询操作是非常容易的,而且数据库也能够用通用语句轻易实现。但是当上述信息部确定时,通常的匹配方法有两种,一种方法是通用匹配、通配符匹配和范围匹配组合查询,这种方式的缺点是计算运算量大,用户往往需要多次反复,才能得到需要的记录,用户体验差;二是单值匹配下的病人姓名模糊语义,这种方式的实现需要屏蔽大小写、位置、口音和字符编码,甚至语音。比如,DICOM3.0规范提供的例子就是:查询“Swain”需要返回“Swayne”,查询“Smith^Mary”需要返回“Mary^Smith”或“Mary Smith”或“Smith,Mary”。在查询、检索、设备工作清单、设备完成检查步骤等服务中,明确要求提供病人姓名模糊语义匹配方法。对于病人姓名模糊语义匹配,很多影像服务器系统是通过数据库结构化查询语言SQL的like模糊查询语句实现,即是在一个字符型字段列中检索所包含的对应关键字。但是,Like语句查询效率低,基本无法优化性能,而且查询结果匹配性也不好。
技术实现思路
本专利技术解决的问题是提供一种病人姓名模糊语义查询的方法,不仅查询速度快、匹配性强,而且能有效地屏蔽了发音不准、口音、位置和大小写等因素。为了解决上述问题,本专利技术提供了一种病人姓名模糊语义查询的方法,包括:(1)为拼音字母设置对应的整型常量权值;(2)根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常量权值和;(3)将所述权值和进行向右移位操作,建立所述病人相对应的姓索引和名索引;(4)将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询,若匹配,则查询结束;若不匹配,则根据所述步骤(2)和步骤(3)建立所述待匹配病人的姓索引和名索引,查询结束。上述所述的病人姓名模糊语义查询方法,其中,所述拼音字母为声母、单韵母和复韵母。上述所述的病人姓名模糊语义查询方法,其中,将所述拼音字母中易出错的拼音字母设置为相同的或差额小的整形常量权值。上述所述的病人姓名模糊语义查询方法,其中,所述声母的整型常量权值大于所述复韵母的整型常量权值,所述复韵母的整型常量权值大于所述单韵母的整型常量权值。上述所述的病人姓名模糊语义查询方法,其中,所述单韵母在常用汉字中出现的次数和所述单韵母的整型权值成反比。上述所述的病人姓名模糊语义查询方法,其中,所述拼音字母的整型权值以质数序列按位分布。上述所述的病人姓名模糊语义查询方法,其中,若所述病人姓名的字符集是中文,则将所述病人的姓名转换为标准拼音形式。上述所述的病人姓名模糊语义查询方法,其中,上述所述的病人姓名模糊语义查询方法,其中,所述向右移位操作可配置。与现有技术相比,本专利技术以病人中文姓名对应的拼音字母集合为输入值,建立索引模型,该索引模型不仅算法简洁、可实现性强、运算量小,还能有效地屏蔽发音不准、口音、位置和大小写等因素。而且查询速度快、匹配性强、用户体验好,可以适应不同的方言环境和操作场景。附图说明图1所示为本专利技术实施例病人姓名模糊语义查询方法的流程示意图;图2所示为本专利技术实施例拼音字母的整型常量权值表。具体实施方式在下面的描述中阐述了很多具体细节以便于充分理解本专利技术。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本专利技术内涵的情况下做类似推广,因此本专利技术不受下面公开的具体实施的限制。其次,本专利技术利用示意图进行详细描述,在详述本专利技术实施例时,为便于说明,所述示意图只是实例,其在此不应限制本专利技术保护的范围。下面结合附图和实施例对本专利技术进行详细地说明。本专利技术病人姓名模糊语义查询方法如图1所示,首先,执行步骤S1,为拼音字母设置对应的整型常量权值。具体地,在本实施例中,如图2所示,所述拼音字母为声母、单韵母和复韵母。对于拼音字母中易出错的拼音字母设置为相同的或差额小的整型常量权值。比如对于声母L和N,ZH和Z,CH和C,SH和H以及H和F,由于方言等因素容易出错,则将它们的整型常量权值设置为相同。需要说明的是,也可以将它们设置为差额小的整型常量权值。比如,L和N的整型常量权值的差额的绝对值小于e,e为正整数(如e=1)。对于单韵母和复韵母也和声母一样,对于易出错的,设置相同的或差额小的整型常量权值。此外,对于除了易出错拼音字母的拼音字母,由于声母出错几率应小于复韵母,复韵母出错几率应小于单韵母,因此,所述声母的整型常量权值大于复韵母的整型常量权值,所述复韵母的整型常量权值大于单韵母的整型常量权值。而且,单韵母出现几率越高,出错几率越高,因此,单韵母在常用汉字中出现的次数和其整型常量权值成反比,即出现次数越高的单韵母,其整形常量权值越小。为了减少权值相加后重合的几率,拼音字母的整型常量权值以质数序列按位分布。在本实施例中,所述质数序列为(3,5,7,B...),如图2所示,对于声母,出现几率较高的声母,其整型常量权值越小,如声母N、G、F和B,N出现的几率比较高,其整型常量权值在这四个声母中最小,而且,声母N、G、F和B按照质数序列分布。需要说明的是,对于长度为N的整型常量权值,只要其中一位按照质数序列分布即可。对于单韵母和复韵母,也和声母一样,按照质数序列进行分布。需要说明的是,整型常量权值表可以根据实际的情况进行配置。接着,执行步骤S2,根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常量权值本文档来自技高网
...

【技术保护点】
一种病人姓名模糊语义查询的方法,其特征在于,包括如下步骤:(1)为拼音字母设置对应的整型常量权值;(2)根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常量权值和;(3)将所述权值和进行向右移位操作,建立所述病人相对应的姓索引和名索引;(4)将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询,若匹配,则查询结束;若不匹配,则根据所述步骤(2)和步骤(3)建立所述待匹配病人的姓索引和名索引,查询结束。

【技术特征摘要】
1.一种病人姓名模糊语义查询的方法,其特征在于,包括如下步骤:
(1)为拼音字母设置对应的整型常量权值;
(2)根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常
量权值和;
(3)将所述权值和进行向右移位操作,建立所述病人相对应的姓索引和名
索引;
(4)将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询,若
匹配,则查询结束;若不匹配,则根据所述步骤(2)和步骤(3)建
立所述待匹配病人的姓索引和名索引,查询结束。
2.如权利要求1所述的病人姓名模糊语义查询的方法,其特征在于,所述拼
音字母为声母、单韵母和复韵母。
3.如权利要求2所述的病人姓名模糊语义查询的方法,其特征在于,将所述
拼音字母中易出错的拼音字母设置为相同的或差额...

【专利技术属性】
技术研发人员:张绪广陈文娟
申请(专利权)人:上海联影医疗科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1