基于频数的围标团体提名算法制造技术

技术编号:32963095 阅读:19 留言:0更新日期:2022-04-09 10:57
本发明专利技术适用于信息技术领域,提供了一种基于频数的围标团体提名算法,利用投标单位与标段之间的对应关系,分组集合进行比较,计算中标率,得出围标团体;本发明专利技术避免了围标团体提名中排列组合问题的阶乘爆炸问题,大幅优化了搜索空间,极大地节约了对内存的开销,因候选集合的减小,生成,对比,计数等阶段的时间复杂度都大幅减小。故本算法可以实现招投标中围标团体提名的日级更新。团体提名的日级更新。

【技术实现步骤摘要】
[ta,tb,bx]、[ta,tb,by]、[ta,tb,bz]、...;
[0016]S6:任意两个投标单位id对应的标段id生成一个数据集,即[[任意两个投标单位id 集合],[标段id集合]],即[[ta,tb],[bx,by,bz,...]];若干个任意两个投标单位id生成 若干个数据集;
[0017]S7:对S6生成的若干所述数据集遍历比较,如果任意一个数据集的标段id集合是另一 个数据集的标段id集合的子集,则将两个所述数据集的投标单位id集合的交集赋值给所述 子集所在的投标单位id集合;得到若干投标单位id集合及对应的共同投标标段id集合;
[0018]S8:对S7数据去重,生成投标单位id和共同投标标段id集合,表示为:
[0019][[{投标单位集合1},{共同投标标段id集合1}],[{投标单位集合2},{共同投标标段 id集合2}],...,[{投标单位集合n},{共同投标标段id集合n}]];
[0020]S9:共同投标标段id集合对应的投标单位集合为涉嫌围标团体;
[0021]S10:计算涉嫌围标团体的中标率,将中标率与所述阈值进行对比,中标率高于阈值的 标记所述涉嫌围标团体;中标率低于阈值的,无围标嫌疑,结束对比。
[0022]优选的,步骤S10中的中标率=中标单位id集合与所述涉嫌围标团体的投标单位id集 合的交集个数/所述涉嫌围标团体的投标单位id集合个数。
[0023]与现有技术相比,本专利技术的有益效果是:本专利技术通过优化计算过程中的全排列问题大幅 缩减了时间复杂度和空间复杂度,避免了高阶组合的搜送空间阶乘爆炸问题;时间复杂度从 周级减少到分钟级,空间复杂度从几十GB缩减到百兆级,达到了生产环境中每日更新的需 求。
具体实施方式
[0024]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合实施例,对本专利技术进行 进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定 本专利技术。
[0025]本专利技术提供一种技术方案:基于频数的围标团体提名算法,包括以下步骤:
[0026]S1:逐一读取投标记录数据,所述投标记录数据包括投标单位id、标段id,每个投标 单位id对应一个标段id;每个投标单位对应一个投标单位id,每个标段对应一个标段id; 每个投标单位不一定对应唯一一个标段;
[0027]S2:遍历投标记录数据,若投标单位id只出现1次,将该投标单位id及对应的标段id 筛除;出现2次或2次以上的投标单位id对应的标段id为预处理后的投标记录数据;
[0028]S3:预处理后的投标记录数据依次编号,投标单位id编号为:t1,t2,t3,...,tn,标段 id编号为:b1,b2,b3,...,bm;所述投标单位id与所述标段id的编号下角标不是对应关系;
[0029]S4:基于标段id进行分组,同一标段id对应的所有投标单位id为一组,即 [[[t1,t2,t3,...]b1],...,[[tx,ty,tz,...]bm]];
[0030]S5:根据S4中的分组,同一标段id对应的任意两个投标单位id生成三元组,即 [ta,tb,bx]、[ta,tb,by]、[ta,tb,bz]、...;
[0031]S6:任意两个投标单位id对应的标段id生成一个数据集,即[[任意两个投标单位
id 集合],[标段id集合]],即[[ta,tb],[bx,by,bz,...]];若干个任意两个投标单位id生成 若干个数据集;
[0032]S7:对S6生成的若干所述数据集遍历比较,如果任意一个数据集的标段id集合是另一 个数据集的标段id集合的子集,则将两个所述数据集的投标单位id集合的交集赋值给所述 子集所在的投标单位id集合;得到若干投标单位id集合及对应的共同投标标段id集合;
[0033]S8:对S7数据去重,生成投标单位id和共同投标标段id集合,表示为:
[0034][[{投标单位集合1},{共同投标标段id集合1}],[{投标单位集合2},{共同投标标段 id集合2}],...,[{投标单位集合n},{共同投标标段id集合n}]];
[0035]S9:共同投标标段id集合对应的投标单位集合为涉嫌围标团体;
[0036]S10:计算涉嫌围标团体的中标率,中标率=中标单位id集合与所述涉嫌围标团体的投 标单位id集合的交集个数/所述涉嫌围标团体的投标单位id集合个数,将中标率与所述阈 值进行对比,中标率高于阈值的标记所述涉嫌围标团体;中标率低于阈值的,无围标嫌疑, 结束对比。
[0037]现有技术通过自根节点生成完成的组合树,造成高空间复杂度和高时间复杂度。本专利技术 先生成所有二阶排列的叶子结点,在根据条件判断地向上合并,极大地缩减了待选集合的大 小,故降低了空间复杂度和时间复杂度。在时间复杂度上,与现有技术相比从周级的计算时 间缩减到分钟级别;在空间复杂度上,由几十GB的内存开销缩减到百兆级别;使得该提名 算法可以实现每日对招投标数据的监管。
[0038]现有技术需要根据不同的标段投标记录作为根节点单独生成一颗树,不同标段的数据组 成一个森林,并在内存中存储森林中的所有节点再进行遍历比对计数。本专利技术先根据投标记 录生成所有叶子结点,在根据共同投标方组合(tx,ty)对叶子结点进行合并,再对合并后 的(tx,ty)对应的标段进行交并运算,充分利用了原有方法中森林的稀疏性(绝大多数结 点无意义)避免了巨量的存储和重复比对。
[0039]本专利技术避免了围标团体提名中排列组合问题的阶乘爆炸问题,大幅优化了搜索空间,极 大地节约了对内存的开销。因候选集合的减小,生成,对比,计数等阶段的时间复杂度都大 幅减小。故该算法可以实现招投标中围标团体提名的日级更新。
[0040]以上所述仅为本专利技术的较佳实施例而已,并不用以限制本专利技术,凡在本专利技术的精神和原 则之内所作的任何修改、等同替换和改进等,均应包含在本专利技术的保护范围之内。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于频数的围标团体提名算法,其特征在于:包括以下步骤:S1:逐一读取投标记录数据,所述投标记录数据包括投标单位id、标段id,每个投标单位id对应一个标段id;S2:遍历投标记录数据,若投标单位id只出现1次,将该投标单位id及对应的标段id筛除;出现2次或2次以上的投标单位id对应的标段id为预处理后的投标记录数据;S3:预处理后的投标记录数据依次编号,投标单位id编号为:t1,t2,t3,...,tn,标段id编号为:b1,b2,b3,...,bm;S4:基于标段id进行分组,同一标段id对应的所有投标单位id为一组,即[[[t1,t2,t3,...]b1],...,[[tx,ty,tz,...]bm]];S5:根据S4中的分组,同一标段id对应的任意两个投标单位id生成三元组,即[ta,tb,bx]、[ta,tb,by]、[ta,tb,bz]、...;S6:任意两个投标单位id对应的标段id生成一个数据集,即[[任意两个投标单位id集合],[标段id集合]],即[[ta,tb],[bx,by,bz,...]];若干个任意两个投标单位id生成若干个数据集;S7:对S6生成的若干所述数据集遍历比较,如果任意一个数据集的标段id集合是另一个数据集的标段id集合的子集,则将两个所述数据集的投标单位id集合的交集赋值给所述子集所在...

【专利技术属性】
技术研发人员:童禹臻程常清邓洁芃周峻平韩智勇
申请(专利权)人:山西金蝉电子商务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1