【技术实现步骤摘要】
本专利技术涉及计算机检索
,具体而言,涉及一种PDF样例文件的检索方法和装置。
技术介绍
印刷行业的软件测试过程中,通过I3DF的样例文件对软件进行测试。这些PDF样例文件具有用于测试的属性,如字符属性、颜色属性等。当需要测试软件的某项功能时,需要查找具有相应属性的PDF样例文件。目前,相关技术中检索用于测试的HF样例文件的过程包括将HF样例文件用于测试的属性按照命名规则构成其自身的名称;确定用于测试的样例文件所具有的属性;在PDF样例文件的名称中检索是否包含确定的属性,如果包含,则将检索到的PDF样例文件作为用于测试的PDF样例文件。由于文件名长度有限,不能记录文件的全部属性,所以查找的范围比较有限。
技术实现思路
本专利技术旨在提供一种PDF样例文件的检索方法和装置,以解决上述由于文件名长度有限,不能记录文件的全部属性,所以查找的范围比较有限的问题。在本专利技术的实施例中,提供了一种PDF样例文件的检索方法,包括按照由文件属性和/或对象属性组成的逻辑表达式在存储的多条总记录和/或分记录中检索,确定对应的PDF样例文件;其中,每条所述总记录用于存储从每个PD ...
【技术保护点】
一种PDF样例文件的检索方法,其特征在于,包括:按照由文件属性和/或对象属性组成的逻辑表达式在存储的多条总记录和/或分记录中检索,确定对应的PDF样例文件;其中,每条所述总记录用于存储从每个PDF样例文件解析的与文件属性集合中相同的文件属性、以及对应的表索引;所述表索引指向的表包括:多条分记录,每条所述分记录用于存储从所述总记录对应的PDF样例文件解析的与对象属性集合中相同的对象属性;每条所述分记录存储的对象属性来源于所述总记录对应的PDF样例文件中的一页。
【技术特征摘要】
1.一种PDF样例文件的检索方法,其特征在于,包括 按照由文件属性和/或对象属性组成的逻辑表达式在存储的多条总记录和/或分记录中检索,确定对应的PDF样例文件;其中,每条所述总记录用于存储从每个PDF样例文件解析的与文件属性集合中相同的文件属性、以及对应的表索引;所述表索引指向的表包括多条分记录,每条所述分记录用于存储从所述总记录对应的PDF样例文件解析的与对象属性集合中相同的对象属性;每条所述分记录存储的对象属性来源于所述总记录对应的HF样例文件中的一页。2.根据权利要求1所述的方法,其特征在于,所述总记录通过以下步骤生成 从每个所述PDF样例文件中解析出文件头; 判断所述文件头中是否具有与文件属性集合中相同的文件属性; 如果有,则将所述相同的文件属性存储在每个所述PDF样例文件对应的每条所述总记录中。3.根据权利要求2所述的方法,其特征在于,所述分记录通过以下步骤生成 从每个所述PDF样例文件解析出所述文件头的同时,解析出内容流和交叉索引表; 通过所述交叉索引表在所述内容流中定位当前解析的PDF样例文件中每页的对象; 判断所述每页的对象中是否具有与所述对象属性集合中相同的对象属性; 如果有,则将所述相同的对象属性存储在对应的每条所述分记录中。4.根据权利要求1或2所述的方法,其特征在于,所述文件属性至少包括以下之一 生成所述PDF样例文件的软件类型属性、PDF版本属性、预分色属性、总页码属性、输出描述属性、加密属性、PDFX版本属性。5.根据权利要求1或3所述的方法,其特征在于,所述对象属性至少包括以下之一 注释内容属性、图像对象属性、渐变属性、路径属性、字体属性、字体内容属性、色彩空间类型属性、函数属性、透明属性、填充属性。6.根据权利要求1所述的方法,...
【专利技术属性】
技术研发人员:张立业,康怡暖,孙雯文,
申请(专利权)人:北大方正集团有限公司,北京北大方正电子有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。