PDF关键字定位方法、装置及存储介质制造方法及图纸

技术编号:35456261 阅读:12 留言:0更新日期:2022-11-03 12:14
本申请提供一种PDF关键字定位方法及相关设备,由此可以更好的满足PDF签名时所需签名定位的需求,同时无需安装第三方软件单独处理,极大的提高性能。该方法包括:读取目标PDF文档内容;确定目标PDF文档内容所对应的N个关键字;计算目标关键字所对应的位置信息;根据位置信息计算所述目标关键字所对应的第一位置的位置信息;根据第一位置的位置信息确定目标关键字所对应的第二位置的位置信息;根据目标页面的页面尺寸、第一位置的位置信息以及第二位置的位置信息确定第一位置与目标页面的第一比例值以及第二位置与目标页面的第二比例值;根据第一位置的位置信息、第二位置的位置信息、第一比例值以及第二比例值对目标关键字进行定位。字进行定位。字进行定位。

【技术实现步骤摘要】
PDF关键字定位方法、装置及存储介质


[0001]本申请属于数据处理领域,特别涉及一种PDF关键字定位方法、装置及存储介质。

技术介绍

[0002]PDF文档签名指定签名位置主要是通过页面指定签名位置,Saas电子签名平台越来越普及的情况下,许多业务场景不能实现在PDF文档页面直接设置签名位置,而越来越多的需求是希望通过指定关键字在关键字附近实现指定签名位置,而SaaS平台多使用java语言开发,现有市场上没有完善的基于java语言实现PDF文档关键字查询方法。
[0003]PDF文档关键字定位方法实现的软件有adobe相关软件产品、福昕PDF阅读器、WPS OFFICE软件等。实现PDF文档关键字定位方法的类库基于java语言开发的有ITEXT、PDFBOX等,基于C语言开发的有MUPDF等。
[0004]然而,PDF阅读软件未对外开放API接口,第三方应用无法使用该方法,且非java语言开发,嵌入基于java语言开发的电子签名平台存在兼容问题。

技术实现思路

[0005]本申请提供一种PDF关键字定位方法、装置及存储介质,可以解决电子签名平台的兼容问题,同时通过第三方应用对PDF阅读软件中关键字进行定位。
[0006]本申请第一方面提供了一种PDF关键字定位方法,包括:
[0007]读取目标PDF文档内容;
[0008]确定所述目标PDF文档内容所对应的N个关键字,其中,所述N为大于或等于1的整数;
[0009]计算目标关键字所对应的位置信息,所述目标关键字为所述N个关键字中的任意一个关键字;
[0010]根据所述位置信息计算所述目标关键字所对应的第一位置的位置信息;
[0011]根据所述第一位置的位置信息确定所述目标关键字所对应的第二位置的位置信息;
[0012]根据目标页面的页面尺寸、所述第一位置的位置信息以及所述第二位置的位置信息确定所述第一位置与所述目标页面的第一比例值以及所述第二位置与所述目标页面的第二比例值,所述目标页面为所述目标关键字所对应的页面;
[0013]根据所述第一位置的位置信息、所述第二位置的位置信息、第一比例值以及第二比例值对所述目标关键字进行定位。
[0014]本申请第二方面提供了一种PDF关键字定位的装置,包括:
[0015]读取单元,用于读取目标PDF文档内容;
[0016]第一确定单元,用于确定所述目标PDF文档内容所对应的N个关键字,其中,所述N为大于或等于1的整数;
[0017]第一计算单元,用于计算目标关键字所对应的位置信息,所述目标关键字为所述N
个关键字中的任意一个关键字;
[0018]第二计算单元,用于根据所述位置信息计算所述目标关键字所对应的第一位置的位置信息;
[0019]第二确定单元,用于根据所述第一位置的位置信息确定所述目标关键字所对应的第二位置的位置信息;
[0020]第三确定单元,用于根据目标页面的页面尺寸、所述第一位置的位置信息以及所述第二位置的位置信息确定所述第一位置与所述目标页面的第一比例值以及所述第二位置与所述目标页面的第二比例值,所述目标页面为所述目标关键字所对应的页面;
[0021]定位单元,用于根据所述第一位置的位置信息、所述第二位置的位置信息、第一比例值以及第二比例值对所述目标关键字进行定位。
[0022]一种可能的设计中,所述第二计算单元具体用于:
[0023]通过如下公式计算所述目标关键字所对应的第一位置的位置信息,所述第一位置为所述目标关键字所对应的左上点、左下点、右上点以及右下点:
[0024][0025][0026][0027][0028]其中,(X
左上
,Y
左上
)为所述左上点的位置信息,(X
左下
,Y
左下
)为所述左下点的位置信息,(X
右上
,Y
右上
)为所述右上点的位置信息,(X
右上
,Y
右上
)为所述右下点的位置信息,(x1,y1)为所述目标关键字中第一个字的位置信息,(x2,y2)为所述目标关键字中最后一个字的位置信息。
[0029]一种可能的设计中,所述第二确定单元具体用于:
[0030]根据所述第一位置的位置信息对所述目标关键字是否换行或换页进行判断,以得到判断结果;
[0031]根据所述判断结果确定所述目标关键字所对应的第二位置的位置信息。
[0032]一种可能的设计中,所述第二确定单元根据所述判断结果确定所述目标关键字所对应的第二位置的位置信息包括:
[0033]若所述判断结果为所述目标关键字存在换行或换页,则通过如下公式确定所述第二位置的位置信息,所述第二位置包括所述目标关键字所对应的左中点和右中点:
[0034][0035][0036]其中,(X
左中
,Y
左中
)为所述左中点的位置信息,(X
左上
,Y
左上
)为所述左上点的位置信息,(X
右中
,Y
右中
)为所述右中点的位置信息,(X
右上
,Y
右上
)为所述右上点的位置信息;
[0037]若所述判断结果为所述目标关键字不存在换行或换页,则通过如下公式确定所述第二位置信息,所述第二位置包括所述目标关键字所对应的上中点、下中点、左中点、右中点以及中中点:
[0038][0039][0040][0041][0042][0043]其中,(X
上中
,Y
上中
)为所述上中点的位置信息,(X
下中
,Y
下中
)为所述下中点的位置信息,(X
左中
,Y
左中
)为所述左中点的位置信息,(X
右中
,Y
右中
)为所述右中点的位置信息,(X
中中
,Y
中中
)为所述中中点的位置信息,(X
左上
,Y
左上
)为所述左上点的位置信息,(X
左下
,Y
左下
)为所述左下点的位置信息,(X
右上
,Y
右上
)为所述右上点的位置信息,(X
右上
,Y
右上
)为所述右下点的位置信息。
[0044]一种可能的设计中,所述第二确定单元根据所述第一位置的位置信息对所述目标关键字是否换行或换页进行判断,以得到判断结果包括:
[0045]判断所述左下点的y值是否大于所述右上点的y值;
[0046]若是,则将所述判断结果确定为所述目标关键字换行;
[0047]判断所述目标关键字的第一个字所在的页面与所述目标关键字的最后一个字所在的页面是否相同;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种PDF关键字定位方法,其特征在于,包括:读取目标PDF文档内容;确定所述目标PDF文档内容所对应的N个关键字,其中,所述N为大于或等于1的整数;计算目标关键字所对应的位置信息,所述目标关键字为所述N个关键字中的任意一个关键字;根据所述位置信息计算所述目标关键字所对应的第一位置的位置信息;根据所述第一位置的位置信息确定所述目标关键字所对应的第二位置的位置信息;根据目标页面的页面尺寸、所述第一位置的位置信息以及所述第二位置的位置信息确定所述第一位置与所述目标页面的第一比例值以及所述第二位置与所述目标页面的第二比例值,所述目标页面为所述目标关键字所对应的页面;根据所述第一位置的位置信息、所述第二位置的位置信息、第一比例值以及第二比例值对所述目标关键字进行定位。2.根据权利要求1所述的方法,其特征在于,所述根据所述位置信息计算所述目标关键字所对应的第一位置的位置信息包括:通过如下公式计算所述目标关键字所对应的第一位置的位置信息,所述第一位置为所述目标关键字所对应的左上点、左下点、右上点以及右下点:述目标关键字所对应的左上点、左下点、右上点以及右下点:述目标关键字所对应的左上点、左下点、右上点以及右下点:述目标关键字所对应的左上点、左下点、右上点以及右下点:其中,(X
左上
,Y
左上
)为所述左上点的位置信息,(X
左下
,Y
左下
)为所述左下点的位置信息,(X
右上
,Y
右上
)为所述右上点的位置信息,(X
右上
,Y
右上
)为所述右下点的位置信息,(x1,y1)为所述目标关键字中第一个字的位置信息,(x2,y2)为所述目标关键字中最后一个字的位置信息。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一位置的位置信息确定所述目标关键字所对应的第二位置的位置信息包括:根据所述第一位置的位置信息对所述目标关键字是否换行或换页进行判断,以得到判断结果;根据所述判断结果确定所述目标关键字所对应的第二位置的位置信息。4.根据权利要求3所述的方法,其特征在于,所述根据所述判断结果确定所述目标关键字所对应的第二位置的位置信息包括:若所述判断结果为所述目标关键字存在换行或换页,则通过如下公式确定所述第二位置的位置信息,所述第二位置包括所述目标关键字所对应的左中点和右中点:
其中,(X
左中
,Y
左中
)为所述左中点的位置信息,(X
左上
,Y
左上
)为所述左上点的位置信息,(X
右中
,Y
右中
)为所述右中点的位置信息,(X
右上
,Y
右上
)为所述右上点的位置信息;若所述判断结果为所述目标关键字不存在换行或换页,则通过如下公式确定所述第二位置信息,所述第二位置包括所述目标关键字所对应的上中点、下中点、左中点、右中点以及中中点:及中中点:及中中点:及中中点:及中中点:其中,(X
上中
,Y
上中
)为所述上中点的位置信息,(X
下中
,Y
下中
)为所述下中点的位置信息,(X
左中
,Y
左中
)为所述左中点的位置信息,(X...

【专利技术属性】
技术研发人员:郭晋韦利东
申请(专利权)人:上海亘岩网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1