一种基于电子投标文件比对的围串标行为检测方法及装置制造方法及图纸

技术编号:33530537 阅读:59 留言:0更新日期:2022-05-19 02:00
本发明专利技术提供一种基于电子投标文件比对的围串标行为检测方法及装置,方法包括:将投标文件转换为纯文本,将纯文本进行去噪,并将其中和招标的采购文件中信息一致的内容去除,得到有效文本文档;将所有的有效文本文档进行分句,筛选其中设定句子,并计算句子的simhash值,将不同有效文本文档的相似句子查找出来,并将其中连续的句子拼接,得到相似信息;将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;根据法规、上述得到信息进行对比判断投标人是否为围串标行为;可以更为直观准确的定位出可能存在的围串标行为,进一步减少平时专家的工作量,提升评审专家的效率。提升评审专家的效率。提升评审专家的效率。

【技术实现步骤摘要】
一种基于电子投标文件比对的围串标行为检测方法及装置


[0001]本专利技术涉及计算机
,特别涉及一种基于电子投标文件比对的围串标行为检测方法及装置。

技术介绍

[0002]现有在招标时,供应商为了利益,可能会出现围标或者串标行为,这就极大的损害了招标者的利益;若是仅仅是通过人为阅读和比较投标文件,则效率低下,且准确率不高;若是采用软件方式存在以下三大问题:
[0003]一、可靠性(准确率)不高,存在较大的误判可能:
[0004]实操中,相似度多高能判断为围串标,在不同的采购项目或是在不同的场景中,并没法得出一个确定的参考值,检测出的相似度不能直接作为判断围串标的直接依据;
[0005]二、仅通过相似度,并不能标识出两份投标文件具体哪些内容存在相同:
[0006]基于第一点的情况,在检测出高相似度的两份投标文件时,评审专家需要人工介入判断是否存在围串标行为,仅一个相似度信息,评审专家无法快速定位出哪些内容是高度一致或相似的,还是需要人工两份投标文件完整的阅读比对;
[0007]三、一些关键的能够判定围本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于电子投标文件比对的围串标行为检测方法,其特征在于:包括:步骤1、将投标文件转换为纯文本,将纯文本进行去噪,并将其中和招标的采购文件中信息一致的内容去除,得到有效文本文档;步骤2、将所有的有效文本文档进行分句,筛选其中设定句子,并计算句子的simhash值,将不同有效文本文档的相似句子查找出来,并将其中连续的句子拼接,得到相似信息;步骤3、将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;步骤4、根据法规、步骤2中得到信息以及步骤3中得到信息进行对比判断投标人是否为围串标行为。2.根据权利要求1所述的一种基于电子投标文件比对的围串标行为检测方法,其特征在于:还包括步骤5、根据设定需求将步骤2中的信息、步骤3中的信息以及步骤4中的结果进行显示。3.根据权利要求1所述的一种基于电子投标文件比对的围串标行为检测方法,其特征在于:所述步骤2进一步具体为:根据设定的标点符号作为句子的分隔符将所有的有效文本文档进行分句;筛选其中设定句子:首先将同一有效文本文档中相同的句子做去重处理,然后将选出长度大于预设定长度的句子;计算每句选出句子的simhash值;遍历取出一有效文本文档的所有simhash值,依次和另一有效文本文档的所有simhash值做海明距离计算;将海明距离小于预设值的两组simhash值所对应的句子标记为相似句子;若其中存在连续的句子,则进行拼接,得到相似信息。4.根据权利要求1所述的一种基于电子投标文件比对的围串标行为检测方法,其特征在于:所述步骤3进一步具体为:将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;所述基础关键信息包括:中文姓名、电话号码、地址、电子邮箱以及公司名称;所述中文姓名提取:基于mmseg算法以及中文姓氏词库,将有效文本文档中的姓名信息识别并提取出来,并将提取出的姓名信息存储进数据库中;所述电话号码提取:使用正则表达式提取出有效文本文档中的电话号码,并将提取出的电话号码信息存储进数据库中;所述地址提取:基于mmseg算法、行政区划词库及地址词库,将有效文本文档中地址信息识别并提取出来,并将提取出的地址信息存储进数据库中;所述电子邮箱提取:使用正则表达式提取出有效文本文档中的电子邮箱信息,并将提取出的电子邮箱信息存储进数据库中;所述公司名称提取:基于mmseg算法以及公司名称词库,将有效文本文档中的公司名称信息识别并提取出来,并将提取出的公司名称信息存储进数据库中;所述报价信息:根据供应商从数据库中获取对应的报价信息;所述供应商电子投标文件制作信息:在供应商上传电子投标文件时,记录下该电子投标文件加密电脑以及上传电脑的mac地址和ip地址;所述投标保证金缴交账户信息:在供应商缴交保证金时,记录下供应商的转出账户户
号以及转入的唯一虚拟保证金户号。5.根据权利要求1所述的一种基于电子投标文件比对的围串标行为检测方法,其特征在于:所述步骤4进一步具体为:将不同供应商的供应商电子投标文件制作信息进行两两比对,如果不同供应商的投标文件加密或上传电脑的mac地址一致,则判定这两家供应商具有围串标嫌疑;将不同供应商的基础信息进行两两比对,如果存在姓名、电话号码、电子邮箱、公司名称以及地址中的一个或多个一致,则将这两家供应商标记为具有围串标可疑行为;将不同供应商的报价信息进行两两比对:

、若两家或多家供应商报价均畸高或者畸低,且报价数额偏差率小于所有供应商报价的整体偏差率;报价畸高或畸低的判定方法:若两家或多家供应商的报价与各供应商的平均报价差异在畸高畸低差异阈值以上,则为报价畸高或畸低;评标基准价=所有供应商投标报价中最低的报价;偏差率=|(投标人报价

评标基准价)|/评标基准价
×
100%;整体偏差率=参与计算的各供应商投标报价偏差率的平均值;

、两家以上供应商报价存在阶梯报价情况阶梯报价判定方法:计算所有供应商投标报价两两间的差值绝对值,找出计算得出的差值绝对值一样且相同个数大于2的所关联的供应商,该关联的供应商的报价即是阶梯报价;当报价信息满足以上任意一个条件时,将对应供应商标记为具有围串标可疑行为;计算出不同投标文件间的相似度值;两份有效文本文档的相似度值Sab计算方法为:计算得出的两份有效文本文档的相似信息内容的文本长度为S;一有效文本文档的文本长度为La;另一有效文本文档的文本长度为Lb;则相似度值Sab=S/Min(La,Lb)*100%,若该相似度值大于设定阈值,则判定这两家供应商具有围串标嫌疑;将对不同供应商的投标保证金缴交账户信息进行两两比对,如果存在不同供应商使用相同的转出账户户号,或者相同的转入的唯一虚拟保证金户号,则直接判定对应供应商存在围串标行为。6.一种基于电子投标文件比对的围串标行为检测装置,其特征在于:包括:投标文件预处理模块,将投标文件转换为纯文本...

【专利技术属性】
技术研发人员:陈荣木林傅荣童晓婷林妍陈小雷林镇勋牛京杰查道鹏
申请(专利权)人:博思数采科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1