【技术实现步骤摘要】
一种专利PDF文档批量重命名的方法及系统
本专利技术涉及PDF文档处理,尤其涉及一种专利PDF文档批量重命名的方法及系统。
技术介绍
已公告的专利文档通常以PDF文档型式存在,PDF文档的命名方式一般为《申请号.pdf》。当保存在本地的PDF专利文档较多时,这种以申请号命名的文档不容易识别,造成查询资料的不便。一般的方法是对该PDF专利文档进行手动重命名。当PDF文档成百上千时,手动命名耗时耗力。为此,急需开发一种PDF文档批量重命名的系统及方法,对PDF文档中的有效信息进行提取,批量重命名,方便科研人员快速辨识专利文档。
技术实现思路
本专利技术要解决的技术问题就在于:针对现有技术存在的技术问题,本专利技术提供一种专利PDF文档重命名的方法及系统,能够提取专利PDF文档中的有效信息并批量重命名,方便科研人员快速辨识专利PDF文档。为解决上述技术问题,本专利技术提出的技术方案为:一种专利PDF文档批量重命名的方法,包括以下步骤:1)进行参数配置并在默认存储路径下创建用于保存 ...
【技术保护点】
1.一种专利PDF文档批量重命名的方法,其特征在于,包括以下步骤:/n1)进行参数配置并在默认存储路径下创建用于保存重命名后的专利PDF文档的目的文件夹;/n2)从源文件夹中选取待处理的专利PDF文档;/n3)解析出被选取的专利PDF文档的文字内容;/n4)筛选并删除文字内容中的报错字符,根据预设的匹配方法提取文字内容中的有效信息,所述匹配方法包括:根据专利PDF文档中专利类型、专利名称、公告号、公告日、申请号、申请人、专利权人和摘要对应部分的开始文字、结束文字以及中间文字的格式对文字内容正则匹配;/n5)对被提取的有效信息重新编辑顺序得到最终文件名,复制被选取的专利PDF ...
【技术特征摘要】
1.一种专利PDF文档批量重命名的方法,其特征在于,包括以下步骤:
1)进行参数配置并在默认存储路径下创建用于保存重命名后的专利PDF文档的目的文件夹;
2)从源文件夹中选取待处理的专利PDF文档;
3)解析出被选取的专利PDF文档的文字内容;
4)筛选并删除文字内容中的报错字符,根据预设的匹配方法提取文字内容中的有效信息,所述匹配方法包括:根据专利PDF文档中专利类型、专利名称、公告号、公告日、申请号、申请人、专利权人和摘要对应部分的开始文字、结束文字以及中间文字的格式对文字内容正则匹配;
5)对被提取的有效信息重新编辑顺序得到最终文件名,复制被选取的专利PDF文档得到专利PDF文档副本,将专利PDF文档副本按照最终文件名重命名,获取用户指定的存储路径,判断用户指定的存储路径和默认存储路径是否一致,是则将重命名后的专利PDF文档副本保存到用户指定的存储路径下的目的文件夹,否则在用户指定的存储路径下创建目的文件夹并将重命名后的专利PDF文档副本保存到用户指定的存储路径下的目的文件夹;
6)更新日志,判断源文件夹中的专利PDF文档是否遍历循环完毕,是则结束并退出,否则返回步骤2)。
2.根据权利要求1所述的专利PDF文档批量重命名的方法,其特征在于,步骤4)具体包括以下步骤:
4.1)获取文字内容;
4.2)筛选并删除文字内容中的报错字符;
4.3)根据专利PDF文档中专利类型、专利名称、公告号、公告日、申请号、申请人、专利权人和摘要对应部分中开始文字、结束文字以及中间文字的格式分别创造匹配专利类型、专利名称、公告号、公告日、申请号、申请人、专利权人和摘要的正则表达式,通过各正则表达式分别对文字内容正则匹配得到有效信息;
4.4)建立字典,将有效信息保存到字典中。
3.根据权利要求2所述的专利PDF文档批量重命名的方法,其特征在于,步骤5)具体...
【专利技术属性】
技术研发人员:刘威葳,李智欢,刘淼,伍兆恒,赵泽,潘海平,肖应辉,
申请(专利权)人:广州兆和电力技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。