一种基于双模型融合的供应商资质审核方法和审核装置制造方法及图纸

技术编号:32971831 阅读:17 留言:0更新日期:2022-04-09 11:40
本发明专利技术提出一种基于双模型融合的供应商资质审核方法,包括:建立用于目标检测算法Light

【技术实现步骤摘要】
一种基于双模型融合的供应商资质审核方法和审核装置


[0001]本专利技术涉及图像处理算法与光学字符识别
,特别是指一种基于双模型融合的供应商资质审核方法和审核装置。

技术介绍

[0002]在信息化时代,项目的招投标过程中的很多流程已经实现了线上处理,如招标方发布采购公告、供应商递交相关标书文件等。在招投标审核环节中对供应商资质能力进行核实,即对供应商的资质、业绩等信息及现场生产情况进行核实确认的活动,是加强供应商产品源头质量管控的重要措施。但由于现有技术的限制,目前在供应商资质能力核实等流程上,主要还是通过人工查阅与审核供应商递交的标书文件方式实现,这不仅大量消耗人力物力财力、工作效率较低,而且也无法确保招投标过程中的公平性。

技术实现思路

[0003]本专利技术的主要目的在于克服现有技术中的上述缺陷,提出一种基于双模型融合的供应商资质审核方法,首先利用设计的目标检测算法对所需要识别的区域进行定位检测,再通过光学字符识别(OCR)技术对其中的中英文字符内容进行识别输出,并根据模板匹配规则判断其中的内容是否符合要求,并进一步给出供应商资质能力是否满足招标人的需求,实现招投标过程中标书文件的自动化审核,有效克服现有的人工审核方式的不足和缺陷。
[0004]本专利技术采用如下技术方案:
[0005]一种基于双模型融合的供应商资质审核方法,包括:
[0006]建立用于目标检测算法Light

BidDet的数据集D1,以及用于中英文字符识别算法E2E

BidOcr的数据集D2,并将两个数据集按照5:1的比例划分成训练集和验证集;
[0007]对Light

BidDet模型和E2E

BidOcr模型,在数据集D1和数据集D2的训练集上进行有监督训练,并在验证集上进行验证,得到训练好的Light

BidDet模型和E2E

BidOcr模型;
[0008]用训练好的目标检测算法Light

BidDet模型对标书文件指定区域的定位检测,再采用训练好的端到端中英文字符识别算法E2E

BidOcr对标书文件中所需识别区域的字符进行识别,得到识别结果;
[0009]建立模板匹配规则和资质能力核实算法,对得到的识别结果进行供应商资质能力审核判断。
[0010]具体地,所述Light

BidDet模型包括:用于特征提取的骨干网络Mobile

ViT,双向融合的特征信息融合网络BiFPN,以及输出类别与检测框的检测头Head;
[0011]所述骨干网络Mobile

ViT包括卷积块、MobileNet模块、MobileViT模块;
[0012]所述双向融合的特征信息融合网络BiFPN为:在特征金字塔网络增加上下文信息融合及跨层连接路径;
[0013]所述输出类别与检测框的检测头Head包括类别预测分支和检测框回归分支。
[0014]具体地,所述E2E

BidOcr模型包括卷积层、循环层和转录层;
[0015]卷积层通过构建卷积神经网络对目标检测算法Light

BidDet模型得到的检测结果图像进行特征提取,得到一系列卷积特征图并转换成特征序列;
[0016]循环层利用双向的长短期记忆人工神经网络对特征序列进行预测,对序列中的每个特征向量进行学习,并输出预测字符标签的分布;
[0017]转录层用于把循环层输出的预测字符标签的分布进一步转换成最终的字符串输出。
[0018]具体地,对Light

BidDet模型和E2E

BidOcr模型,在数据集D1和数据集D2的训练集上进行有监督训练,并在验证集上进行验证,其中在验证集上进行验证具体为:
[0019]Light

BidDet利用IoU=0.5时的平均精确度AP50作为验证指标,当在数据集D1的验证集上AP50≥90%时,Light

BidDet训练完成的模型记为合格;
[0020]E2E

BidOcr采用文字行级别准确率作为评价指标,当在数据集D2的验证集上Accuracy≥90%时,E2E

BidOcr训练完成的模型记为合格。
[0021]具体地,建立模板匹配规则和资质能力核实算法,对得到的识别结果进行供应商资质能力审核判断,具体为:
[0022]建立标书模板匹配库;
[0023]利用ERNIE

Gram模型构建文本语义匹配任务,所述ERNIE

Gram模型利用模糊匹配规则判断待检测文本与标书文本匹配库中的文本进行相似度检测;
[0024]统计语义相似文本所占比例,并进一步根据所占比例的值对供应商资质能力的核实结果进行判断。
[0025]具体地,所述进一步根据所占比例的值对供应商资质能力的核实结果进行判断,具体为:
[0026]当所占比例≥0.9时认定当前所判断的供应商符合资质要求;
[0027]当0.8≤所占比例<0.9时认定当前所判断的供应商具备候补资格,需进一步完善和递交标书文件中的相关材料;
[0028]当所占比例<0.8时认定当前所判断的供应商不符合资质要求。
[0029]本专利技术实施例还一种基于双模型融合的供应商资质审核装置,包括:
[0030]数据集建立模块:建立用于目标检测算法Light

BidDet的数据集D1,以及用于中英文字符识别算法E2E

BidOcr的数据集D2,并将两个数据集按照5:1的比例划分成训练集和验证集;
[0031]模型训练模块:对Light

BidDet模型和E2E

BidOcr模型,在数据集D1和数据集D2的训练集上进行有监督训练,并在验证集上进行验证,得到训练好的Light

BidDet模型和E2E

BidOcr模型;
[0032]模型运算模块:用训练好的目标检测算法Light

BidDet模型对标书文件指定区域的定位检测,再采用训练好的端到端中英文字符识别算法E2E

BidOcr对标书文件中所需识别区域的字符进行识别,得到识别结果;
[0033]资质能力判断模块:建立模板匹配规则和资质能力核实算法,对得到的识别结果进行供应商资质能力审核判断。
[0034]具体地,还包括:
[0035]自动输入及预处理模块,用于调取投标系统中已经上传的标书文件,并将标书文件的格式转换与图片切分,再进行图片灰度化处理与大小尺寸调整操作;
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于双模型融合的供应商资质审核方法,其特征在于,包括:建立用于目标检测算法Light

BidDet的数据集D1,以及用于中英文字符识别算法E2E

BidOcr的数据集D2,并将两个数据集按照5:1的比例划分成训练集和验证集;对Light

BidDet模型和E2E

BidOcr模型,在数据集D1和数据集D2的训练集上进行有监督训练,并在验证集上进行验证,得到训练好的Light

BidDet模型和E2E

BidOcr模型;用训练好的目标检测算法Light

BidDet模型对标书文件指定区域的定位检测,再采用训练好的端到端中英文字符识别算法E2E

BidOcr对标书文件中所需识别区域的字符进行识别,得到识别结果;建立模板匹配规则和资质能力核实算法,对得到的识别结果进行供应商资质能力审核判断。2.根据权利要求1所述的一种基于基于双模型融合的供应商资质审核方法,其特征在于,所述Light

BidDet模型包括:用于特征提取的骨干网络Mobile

ViT,双向融合的特征信息融合网络BiFPN,以及输出类别与检测框的检测头Head;所述骨干网络Mobile

ViT包括卷积块、MobileNet模块、MobileViT模块;所述双向融合的特征信息融合网络BiFPN为:在特征金字塔网络增加上下文信息融合及跨层连接路径;所述输出类别与检测框的检测头Head包括类别预测分支和检测框回归分支。3.根据权利要求1所述的一种基于基于双模型融合的供应商资质审核方法,其特征在于,所述E2E

BidOcr模型包括卷积层、循环层和转录层;卷积层通过构建卷积神经网络对目标检测算法Light

BidDet模型得到的检测结果图像进行特征提取,得到一系列卷积特征图并转换成特征序列;循环层利用双向的长短期记忆人工神经网络对特征序列进行预测,对序列中的每个特征向量进行学习,并输出预测字符标签的分布;转录层用于把循环层输出的预测字符标签的分布进一步转换成最终的字符串输出。4.根据权利要求1所述的一种基于基于双模型融合的供应商资质审核方法,其特征在于,对Light

BidDet模型和E2E

BidOcr模型,在数据集D1和数据集D2的训练集上进行有监督训练,并在验证集上进行验证,其中在验证集上进行验证具体为:Light

BidDet利用IoU=0.5时的平均精确度AP50作为验证指标,当在数据集D1的验证集上AP50≥90%时,Light

【专利技术属性】
技术研发人员:郭素芹倪少峰陈坤梁海涛林瑞安吴高杰罗康润
申请(专利权)人:福建亿力电力科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1