一种基于OCR引擎的投标文件流标信息内容提取、定位、分析方法技术

技术编号:46439579 阅读:7 留言:0更新日期:2025-09-19 20:42
本发明专利技术提供了一种基于OCR引擎的投标文件流标信息内容提取、定位、分析方法,包括以下步骤:招采文件收集:收集参与招标项目的文档文件;文件解析:针对不同类型文档文件,采用相应的信息抽取处理方法,以得到关键信息;招标文件流标项检测:对招标文件中的招标因素标准信息进行抽取,并对招标文件流标项因素进行定位及抽取;投标文件流标项定位:对投标文件的结构和文本进行分析,抽取出标书的目录结构,并对投标文件流标项进行定位;流标项分析:对招标文件中的流标项进行分析;投标文件流标项提示:根据流标项的比对结果进行不符合项提示。提高了对扫描版PDF文档内容识别的精度和准确性,减少了人工校对和修正的工作量,提高了工作效率。

【技术实现步骤摘要】

本专利技术涉及招投标信息处理,具体涉及一种基于ocr引擎的投标文件流标信息内容提取、定位、分析方法。


技术介绍

1、在招投标过程中,投标文件的流标信息(即未中标或不符合要求的投标信息)的提取与分析是企业优化投标策略、提升中标率的重要环节。传统的人工审核方式效率低下,且容易出错。随着信息技术的发展,利用ocr技术对投标文件进行自动化处理成为一种趋势。然而,现有的ocr技术在处理复杂的投标文件时,往往存在识别准确率不高、信息提取不完整等问题。此外,对于流标信息的特定内容提取和分析,现有技术缺乏有效的解决方案。


技术实现思路

1、本专利技术旨在提供一种高效、准确的基于ocr引擎的投标文件流标信息内容提取、定位、分析方法,旨在实现对投标文件中文字内容的高效、准确提取,并能够根据提取内容进行反向定位至投标文件中的具体位置及对提取内容进行有效分析,从而实现流标信息内容提取、定位、分析。

2、为了实现上述的技术特征,本专利技术的目的是这样实现的:一种基于ocr引擎的投标文件流标信息内容提取、定位、分析方法,包括本文档来自技高网...

【技术保护点】

1.一种基于OCR引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种基于OCR引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,所述步骤1中收集参与招标项目的文档文件具体包括:

3.根据权利要求1所述一种基于OCR引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,所述步骤2中不同类型文档文件分为扫描PDF文件和非扫描PDF文件两类,基于不同类型文档文件的标书,进行不同的信息抽取处理方法,以得到关键信息;

4.根据权利要求3所述一种基于OCR引擎的投标文件流标信息内容提取、定位、分析...

【技术特征摘要】

1.一种基于ocr引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种基于ocr引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,所述步骤1中收集参与招标项目的文档文件具体包括:

3.根据权利要求1所述一种基于ocr引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,所述步骤2中不同类型文档文件分为扫描pdf文件和非扫描pdf文件两类,基于不同类型文档文件的标书,进行不同的信息抽取处理方法,以得到关键信息;

4.根据权利要求3所述一种基于ocr引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,对扫描pdf文件内表格进行信息抽取处理方法具体包括:

5.根据权利要求4所述一种基于ocr引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,对扫描pdf文件内附图进行信息抽取处理方法具体包括:

6.根据权利要求5所述一种基于ocr...

【专利技术属性】
技术研发人员:谢淮东卫沈傲蔡伟
申请(专利权)人:中国长江电力股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1