【技术实现步骤摘要】
化验单的识别方法和识别装置
本专利技术主要涉及临床医学及试验领域,具体地涉及一种临床化验单的识别方法和识别装置。
技术介绍
在临床试验领域,通过对大量的受试者进行数据采集,可以分析特定药物或方法的效果。在大部分临床试验中涉及到对受试者进行医学检验,包括从人体提取体液、细胞等样本进行实验室分析,从而获得相关的检验结果。典型的常规化验单包括血常规、尿常规、便常规等。随着电子技术的发展,通过各种信息系统将临床试验中所获得各种数据电子化,从而更加便于对临床信息进行统计和分析。然而,不同的医院所采用的测量仪器可能不同,导致其所获得的化验单中所包含的化验项的名称、单位以及参考范围等不一致,数据记录的格式也不统一,对于后续的数据管理和分析造成了一定的障碍,降低了临床试验的效率。
技术实现思路
本专利技术所要解决的技术问题是提供一种标准化的临床化验单识别方法和装置。本专利技术为解决上述技术问题而采用的技术方案是一种化验单的识别方法,其特征在于,包括:接收化验单图像;采用光学文本识别技术识别所述化验单图像, ...
【技术保护点】
1.一种化验单的识别方法,其特征在于,包括:/n接收化验单图像;/n采用光学文本识别技术识别所述化验单图像,从所述化验单图像中提取多个文字块,所述文字块的信息包括所述文字块的内容和坐标;/n根据所述多个文字块的坐标计算每个所述文字块与其周围的其他文字块的相对位置关系;/n比较所述文字块的内容和医学检验术语数据库中的化验项名称,获得候选化验项名称文字块;/n根据所述文字块的相对位置关系确定所述候选化验项名称文字块右侧的第一文字块组,若所述第一文字块组中包括化验结果文字块,则判断所述候选化验项名称文字块为正式化验项名称文字块;/n生成第二文字块组,所述第二文字块组包括所述正式化 ...
【技术特征摘要】
1.一种化验单的识别方法,其特征在于,包括:
接收化验单图像;
采用光学文本识别技术识别所述化验单图像,从所述化验单图像中提取多个文字块,所述文字块的信息包括所述文字块的内容和坐标;
根据所述多个文字块的坐标计算每个所述文字块与其周围的其他文字块的相对位置关系;
比较所述文字块的内容和医学检验术语数据库中的化验项名称,获得候选化验项名称文字块;
根据所述文字块的相对位置关系确定所述候选化验项名称文字块右侧的第一文字块组,若所述第一文字块组中包括化验结果文字块,则判断所述候选化验项名称文字块为正式化验项名称文字块;
生成第二文字块组,所述第二文字块组包括所述正式化验项名称文字块和所述化验结果文字块;以及
对所述第二文字块组进行标准化处理,将所述正式化验项名称文字块的内容转换为标准化验项名称,并且将所述化验结果文字块的内容转换为标准化验结果。
2.如权利要求1所述的识别方法,其特征在于,根据所述多个文字块的坐标计算每个所述文字块与其周围的其他文字块的相对位置关系的步骤包括:
生成文字块集合,所述文字块集合中包括所有文字块的坐标;
根据每个文字块的纵坐标排序,得到所有文字块的有序列表;以及
在所述有序列表中按照顺序处理每个所述文字块,得到每个文字块的上、下、左、右四个方向的相邻文字块。
3.如权利要求2所述的识别方法,其特征在于,在所述有序列表中按照顺序处理每个所述文字块的步骤包括:
步骤S31:以所述有序列表中的第一个文字块作为第一锚点;
步骤S32:在所述有序列表中搜索所述第一锚点右侧的文字块,以所述第一锚点右侧的文字块为第二锚点,并将搜索结果记录在所述第一锚点的数据结构中;
步骤S33:在所述文字块集合中搜索与所述第二锚点上下相邻的文字块,并将搜索结果记录在所述第二锚点的数据结构中;
步骤S34:在所述有序列表中搜索所述第二锚点右侧的文字块,若有则删除所述第二锚点,并将所述第二锚点右侧的文字块作为新的第二锚点,重复执行步骤S33-S34,直到所述第二锚点右侧没有文字块;
步骤S35:在所述有序列表中搜索所述第一锚点左侧的文字块,以所述第一锚点左侧的文字块为第三锚点,并将搜索结果记录在所述第一锚点的数据结构中;
步骤S36:在所述文字块集合中搜索与所述第三锚点上下相邻的文字块,并将搜索结果记录在所述第三锚点的数据结构中;
步骤S37:在所述有序列表中搜索所述第三锚点左侧的文字块,若有则删除所述第三锚点,并将所述第三锚点左侧的文字块作为新的第三锚点,重复执行步骤S36-S37,直到所述第三锚点左侧没有文字块;
步骤S38:在所述有序列表中删除所述第一锚点、第二锚点和第三锚点;以及
步骤S39:重复执行步骤S31-38,直到所述有序列表为空。
4.如权利要求3所述的识别方法,其特征在于,所述文字块的数据结构中包括记录与所述文字块在上、下、左、右四个方向的相邻文字块的字段。
5.如权利要求1所述的识别方法,其特征在于,比较所述文字块的内容和医学检验术语数据库中的化验项名称的步骤包括:
将所述医学检验术语数据库中的化验项名称拆分成长度相等的第一字段;
将所述文字块的内容拆分成与所述第一字段的长度相等的第二字段;以及
比较所述第一字段和第二字段。
6.如权利要求5所述的识别方法,其特征在于,采用2-gram方法对所述医学检...
【专利技术属性】
技术研发人员:吴大帅,
申请(专利权)人:杭州太美星程医药科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。