【技术实现步骤摘要】
eTMF系统查重方法、装置、电子设备及介质
[0001]本申请涉及信息处理
,尤其涉及一种eTMF系统查重方法、装置、电子设备及介质。
技术介绍
[0002]临床研究电子文档管理系统(eTMF,electronic Trial Master File)是一种通过用户先设置文件夹,再上传文件至指定的文件夹下的一种方便实用的文件管理系统,目前,eTMF系统中在进行电子文档的重复查验时,通常是通过待查文件的文件名称对数据库中重复文件的进行检索,从而判断系统中是否已存储与待查文件重复的文件,但这种重复查验方法会出现文件名称不同但文件内容重复,或是文件名称相同而内容却不重复的情况,从而导致eTMF系统中电子文档的查重准确度偏低。
技术实现思路
[0003]本申请的主要目的在于提供一种eTMF系统查重方法、装置、电子设备及介质,旨在解决eTMF系统中电子文档的查重准确度低的技术问题。
[0004]为实现上述目的,本申请提供一种eTMF系统查重方法,所述eTMF系统查重方法包括:
[0005]将待查文 ...
【技术保护点】
【技术特征摘要】
1.一种eTMF系统查重方法,其特征在于,所述eTMF系统查重方法包括:将待查文件中的文本信息拆分成各部分文本信息,并将各所述部分文本信息转换成对应的待查信息摘要;将各所述待查信息摘要在eTMF系统的数据库中进行检索,若存在相同的信息摘要,则将所述信息摘要对应的重复信息添加到在所述待查文件的重复信息列表中,其中,所述数据库中包括各存储文件对应的信息摘要;根据所述待查文件的重复信息列表,判断所述待查文件在所述数据库中是否有重复信息。2.如权利要求1所述eTMF系统查重方法,其特征在于,所述将待查文件中的文本信息拆分成各部分文本信息,并将各所述部分文本信息转换成对应的待查信息摘要的步骤包括:基于所述文本信息中的标点符号,将所述文本信息拆分为各所述部分文本信息;将各所述部分文本信息进行加密处理,得到各所述部分文本信息对应的待查信息摘要。3.如权利要求1所述eTMF系统查重方法,其特征在于,所述将待查文件中的文本信息拆分成各部分文本信息,并将各所述部分文本信息转换成对应的待查信息摘要的步骤包括:基于所述文本信息中的标点符号,将所述文本信息拆分为各所述部分文本信息;基于各所述部分文本信息在所述文本信息中的顺序,将各所述部分文本信息添加进所述待查文件的文本信息列表中;通过散列函数将所述文本信息列表中的各部分文本信息进行处理,得到各所述部分文本信息对应的待查信息摘要。4.如权利要求3所述eTMF系统查重方法,其特征在于,所述重复信息包括各信息摘要分别对应的部分文本信息、文件序号以及文件名称,所述将各所述待查信息摘要在eTMF系统的数据库中进行检索,若存在相同的信息摘要,则将所述信息摘要对应的重复信息添加到在所述待查文件的重复信息列表中的步骤包括:获取所述待查文件对应的分类号,依据所述分类号确定数据库分组;将所述文本信息列表中的各待查信息摘要依次在所述数据库分组中进行检索;当检索到与所述待查信息摘要匹配的信息摘要时,将所述信息摘要对应的部分文本信息、文件序号以及文件名称添加到所述重复信息列表中。5.如权利要求1所述eTMF系统查重方法,其特征在于,所述重复信息包括各信息摘要分别对应的部分文本信息、文件序号以及文件名称,所述将各所述待查信息摘要在eTMF系统的数据库中进行检索,若存在相同的信息摘要,则将所述信息摘要对应...
【专利技术属性】
技术研发人员:覃龙,吴卫平,苏泉宇,林显东,陈世兵,包敏,
申请(专利权)人:一临云深圳科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。