下载基于PDF文件的段落识别方法、装置及相关介质的技术资料

文档序号:43961504

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了基于PDF文件的段落识别方法、装置及相关介质,该方法包括从PDF文件中提取所有文字对象并按顺序存储至文字容器;遍历文字容器的文字对象得到基线信息;判断当前基线信息与上一个基线信息之间的差距是否满足组合条件,若满足则判定为同一行;...
该专利属于深圳锦牛科技有限公司所有,仅供学习研究参考,未经过深圳锦牛科技有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。