一种自动识别体检信息并数据化的软件系统技术方案

技术编号:38006216 阅读:31 留言:0更新日期:2023-06-30 10:22
本发明专利技术公开一种自动识别体检信息并数据化的软件系统,由存储模块、读取模块、筛查模块、识别模块以及输出模块;存储模块的输出端连接读取模块的输入端,读取模块的输出端连接筛查模块的输入端,筛查模块的输出端连接识别模块的输入端,识别模块的输出端连接所述输出模块的输入端。本发明专利技术的有益效果:本发明专利技术达到了实现自动识别体检信息并数据化的目的,由人工联系机构获取体检人员的原始文件后,经存储、读取、筛查、识别,最终实现高效率输出并获取所有人的体检数据Excel,提高了数据处理速度,简化了人工操作流程,省时省力,可大面积推广应用。广应用。广应用。

【技术实现步骤摘要】
一种自动识别体检信息并数据化的软件系统


[0001]本专利技术涉及数据处理
,具体为一种自动识别体检信息并数据化的软件系统。

技术介绍

[0002]体检时通过医学手段和方法对体检者的体格检查。体检者去医院进行体检之后,会得到体检数据,包括每一个体检项目的体检数据和所有体检完成之后的总检数据。
[0003]通常都会对体检者的体检数据进行整合Excel并电子存档,但是随着体检者的人数增多,体检数据量越来越大,从而影响数据库处理数据的速度,直接影响到每个体检人员体检信息的数据处理。

技术实现思路

[0004]为解决以上现有问题,本专利技术提供一种自动识别体检信息并数据化的软件系统。本专利技术通过以下技术方案实现。
[0005]一种自动识别体检信息并数据化的软件系统;
[0006]所述系统由存储模块、读取模块、筛查模块、识别模块以及输出模块;
[0007]所述存储模块,用于存储由人工联系机构获取的体检人员的原始文件数据;
[0008]所述读取模块,用于读取每个体检人员文件里的基本信息;
[0009]所述筛查模块,用于根据体检项目筛查每个体检人员文件信息;
[0010]所述识别模块,用于识别每个体检人员文件里所需体检项目数据;
[0011]所述输出模块,用于对应每个人员基本信息输出Excel里一列体检人员体检项目数据,并将每个人员体检数据集合输出,获取所有人的体检数据Excel;
[0012]进一步的,所述存储模块的输出端连接所述读取模块的输入端,所述读取模块的输出端连接所述筛查模块的输入端,所述筛查模块的输出端连接所述识别模块的输入端,所述识别模块的输出端连接所述输出模块的输入端。
[0013]进一步的,所述系统利用Python代码,用于读取一组体检报告的文件,然后从中提取有关体检者的各种信息,最后将提取的信息存储到Excel文件中;
[0014]该程序首先解析命令行参数,获取输入和输出文件的路径,然后遍历指定目录下的所有文件,对于每个文件,程序会逐页读取其中的文本和表格信息,并根据预先定义好的规则提取有关体检者的信息。最后,程序将提取的信息存储到Excel文件中。
[0015]本专利技术的有益效果:本专利技术达到了实现自动识别体检信息并数据化的目的,在由人工联系机构获取体检人员的原始文件后,经存储、读取、筛查、识别,最终实现高效率输出并获取所有人的体检数据Excel,提高了数据处理速度,简化了人工操作流程,省时省力,可大面积推广应用。
附图说明
[0016]图1为本专利技术一种自动识别体检信息并数据化的软件系统的系统流程图。
具体实施方式
[0017]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。
[0018]在本专利技术实施例的描述中,需要说明的是,若出现术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该专利技术产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0019]此外,若出现术语“水平”、“竖直”、“悬垂”等术语并不表示要求部件绝对水平或悬垂,而是可以稍微倾斜。如“水平”仅仅是指其方向相对“竖直”而言更加水平,并不是表示该结构一定要完全水平,而是可以稍微倾斜。
[0020]在本专利技术实施例的描述中,“多个”代表至少2个。
[0021]在本专利技术实施例的描述中,还需要说明的是,除非另有明确的规定和限定,若出现术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本专利技术中的具体含义。
[0022]实施例:一种自动识别体检信息并数据化的软件系统,该系统由存储模块、读取模块、筛查模块、识别模块以及输出模块;
[0023]存储模块,用于存储由人工联系机构获取的体检人员的原始文件数据;
[0024]读取模块,用于读取每个体检人员文件里的基本信息;
[0025]筛查模块,用于根据体检项目筛查每个体检人员文件信息;
[0026]识别模块,用于识别每个体检人员文件里所需体检项目数据;
[0027]输出模块,用于对应每个人员基本信息输出Excel里一列体检人员体检项目数据,并将每个人员体检数据集合输出,获取所有人的体检数据Excel;
[0028]其中,存储模块的输出端连接读取模块的输入端,读取模块的输出端连接筛查模块的输入端,筛查模块的输出端连接识别模块的输入端,识别模块的输出端连接输出模块的输入端;
[0029]所述系统利用Python代码,用于读取一组体检报告的文件,然后从中提取有关体检者的各种信息,最后将提取的信息存储到Excel文件中;
[0030]代码中主要用到了argparse、Os、re、pdfplumber等Python库。其中argparse用于解析命令行参数,os用于操作文件,re用于正则表达式匹配,pdfplumber用于读取文件并提取文本和表格;
[0031]该程序首先解析命令行参数,获取输入和输出文件的路径。然后遍历指定目录下的所有文件,对于每个文件,程序会逐页读取其中的文本和表格信息,并根据预先定义好的规则提取有关体检者的信息。最后,程序将提取的信息存储到Excel文件中。
[0032]本专利技术达到了实现自动识别体检信息并数据化的目的,在由人工联系机构获取体检人员的原始文件后,经存储、读取、筛查、识别,最终实现高效率输出并获取所有人的体检数据Excel,提高了数据处理速度,简化了人工操作流程,省时省力,可大面积推广应用。
[0033]以上对本专利技术及其实施方式进行了描述,这种描述没有限制性,附图中所示的也只是本专利技术的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本专利技术创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本专利技术的保护范围。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动识别体检信息并数据化的软件系统,其特征在于:所述系统由存储模块、读取模块、筛查模块、识别模块以及输出模块;所述存储模块,用于存储由人工联系机构获取的体检人员的原始文件数据;所述读取模块,用于读取每个体检人员文件里的基本信息;所述筛查模块,用于根据体检项目筛查每个体检人员文件信息;所述识别模块,用于识别每个体检人员文件里所需体检项目数据;所述输出模块,用于对应每个人员基本信息输出Excel里一列体检人员体检项目数据,并将每个人员体检数据集合输出,获取所有人的体检数据Excel。2.根据权利要求1所述的一种自动识别体检信息并数据化的软件系统,其特征在于:所述存储模块的输出端连接所述读取模块的输入端,所...

【专利技术属性】
技术研发人员:韩英宣国云黄俊翔郭冠亚刘宁孙昊许昂宋子瑞叶茗杨佳琪苏树豪周新民王敬博
申请(专利权)人:中国人民解放军第四军医大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1