【技术实现步骤摘要】
本专利技术涉及招投标信息处理,具体涉及一种基于ocr引擎的投标文件流标信息内容提取、定位、分析方法。
技术介绍
1、在招投标过程中,投标文件的流标信息(即未中标或不符合要求的投标信息)的提取与分析是企业优化投标策略、提升中标率的重要环节。传统的人工审核方式效率低下,且容易出错。随着信息技术的发展,利用ocr技术对投标文件进行自动化处理成为一种趋势。然而,现有的ocr技术在处理复杂的投标文件时,往往存在识别准确率不高、信息提取不完整等问题。此外,对于流标信息的特定内容提取和分析,现有技术缺乏有效的解决方案。
技术实现思路
1、本专利技术旨在提供一种高效、准确的基于ocr引擎的投标文件流标信息内容提取、定位、分析方法,旨在实现对投标文件中文字内容的高效、准确提取,并能够根据提取内容进行反向定位至投标文件中的具体位置及对提取内容进行有效分析,从而实现流标信息内容提取、定位、分析。
2、为了实现上述的技术特征,本专利技术的目的是这样实现的:一种基于ocr引擎的投标文件流标信息内容提取、
...【技术保护点】
1.一种基于OCR引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述一种基于OCR引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,所述步骤1中收集参与招标项目的文档文件具体包括:
3.根据权利要求1所述一种基于OCR引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,所述步骤2中不同类型文档文件分为扫描PDF文件和非扫描PDF文件两类,基于不同类型文档文件的标书,进行不同的信息抽取处理方法,以得到关键信息;
4.根据权利要求3所述一种基于OCR引擎的投标文件流标信息
...【技术特征摘要】
1.一种基于ocr引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述一种基于ocr引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,所述步骤1中收集参与招标项目的文档文件具体包括:
3.根据权利要求1所述一种基于ocr引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,所述步骤2中不同类型文档文件分为扫描pdf文件和非扫描pdf文件两类,基于不同类型文档文件的标书,进行不同的信息抽取处理方法,以得到关键信息;
4.根据权利要求3所述一种基于ocr引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,对扫描pdf文件内表格进行信息抽取处理方法具体包括:
5.根据权利要求4所述一种基于ocr引擎的投标文件流标信息内容提取、定位、分析方法,其特征在于,对扫描pdf文件内附图进行信息抽取处理方法具体包括:
6.根据权利要求5所述一种基于ocr...
【专利技术属性】
技术研发人员:谢淮东,卫沈傲,蔡伟,
申请(专利权)人:中国长江电力股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。