南京吾道知信信息技术有限公司专利技术

南京吾道知信信息技术有限公司共有3项专利

  • 本发明公开了一种多模态金融文档的事件抽取方法和系统,属于数据处理技术领域,所述方法包括:获取待抽取区域及其对象,所述对象包括表格和文本;对所述表格进行解析,获得表格的内容,所述内容包括事件和论元;根据所述表格的事件筛对所述文本进行筛选,...
  • 本发明公开了一种富格式文档的图形识别方法和系统,属于图形识别技术领域,所述方法包括:识别文档页面中图形的区域和类别;基于所述图形类别,获得图形区域中的对象,所述对象包括:形状对象、文本块和连线;根据文本块所在的位置,建立文本块与形状对象...
  • 本发明公开了一种PDF文件中表格信息的提取方法,其特征在于,包括:读取PDF文件;解析PDF文件的属性;找到并整理页面内所有横线以及竖线的集合;判断当前页面的横竖线集合能否组成完整的表格边框,若能则按照有边框表格处理,反之则按照无边框表...
1