【技术实现步骤摘要】
Word文档的解析与填充方法、装置、设备和存储介质
本专利技术涉及计算机
,特别是涉及一种Word文档的解析与填充方法、装置、设备和存储介质。
技术介绍
CRF(病例报告表CaseReportForm)是临床试验中获取研究资料的重要手段,是收集、记录和保存临床试验资料的载体。医生经常会用各种方式收集临床实验数据,这些数据最终都需要被填写到每个病例的Word格式CRF中。目前已经有一些自动生成word文档的方法,但由于CRF的模板通常变动频繁,如果用软件直接生成word难度较大。另外,CRF文件涉及的数据往往较多,一般还需要对数据进行层级化管理,因此,亟需提供一种针对CRF填充场景的自动生成word文档的方案。
技术实现思路
鉴于以上所述现有技术的缺点,本申请的目的在于提供一种Word文档的解析与填充方法、装置、设备和存储介质,以解决现有技术中存在的至少一个问题。为实现上述目的及其他相关目的,本申请提供一种Word文档的解析与填充方法,所述方法包括:获取临床试验数据,并将通过检测的临床 ...
【技术保护点】
1.一种Word文档的解析与填充方法,其特征在于,所述方法包括:/n获取临床试验数据,并将通过检测的临床试验数据上传以进行收录;/n在作为病例报告表模板的Word文档中埋入数据标记以设置为填充点位;/n解析所述Word文档的编排结构并识别所述填充点位,并将收录的所述临床试验数据针对每个所述填充点位关联要填充的数据字段;/n复制一份作为病例报告表的模板的Word文档,并在各所述填充点位分别填充各自所关联的数据字段,以形成最终病例报告表的Word文档。/n
【技术特征摘要】 【专利技术属性】
1.一种Word文档的解析与填充方法,其特征在于,所述方法包括:
获取临床试验数据,并将通过检测的临床试验数据上传以进行收录;
在作为病例报告表模板的Word文档中埋入数据标记以设置为填充点位;
解析所述Word文档的编排结构并识别所述填充点位,并将收录的所述临床试验数据针对每个所述填充点位关联要填充的数据字段;
复制一份作为病例报告表的模板的Word文档,并在各所述填充点位分别填充各自所关联的数据字段,以形成最终病例报告表的Word文档。
2.根据权利要求1所述的方法,其特征在于,所述将通过检测的临床试验数据上传以进行收录,包括:
检测各所述临床试验数据中是否含有唯一确定受试者身份的ID;
将含有所述ID的临床试验数据上传以进行收录,以便依据所述ID进行数据关联;和/或,
检测各所述临床试验数据内部是否出现重复列名;
将未出现重复列名的临床试验数据上传以进行收录,以防止在进行数据关联时出现歧义。
3.根据权利要求1所述的方法,其特征在于,所述Word文档的底层为xml文件,解析所述xml文件可得到所述Word文档的编排结构。
4.根据权利要求1所述的方法,其特征在于,所述解析所述Word文档的编排结构并识别所述填充点位,包括:
调用python的python-docx库解析所述Word文档,以获取所述Word文档基于基本单位的表征编排结构的信息树;
在所述信息树中的各基本单位中寻找埋入的表示所述填充点位的数据标记,并记录在所述word文档中的相应的位置。
技术研发人员:张少典,贾晓鹏,
申请(专利权)人:合肥森亿智能科技有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。