基于传递步长调整的修正聚类处理方法、设备及存储介质技术

技术编号:37396860 阅读:18 留言:0更新日期:2023-04-30 09:24
本发明专利技术公开了基于传递步长调整的修正聚类处理方法、设备及存储介质,方法包括:获取与用户对应的测量参数并采用DBSCAN算法对用户进行聚类分析,得到聚类结果包括目标集合和噪音点,对于噪音点数据基于预定义数据集合进行修正;获取待分析的投标信息,包括当前招投标活动的参与用户;根据聚类结果判断当前招投标活动的参与用户中是否存在关联关系;删除存在关联关系的参与用户后根据传递步长调整参数计算并推荐用户。本发明专利技术实施例通过结合基于密度的聚类算法,避免了传统社团检测算法中需要企业参与投标历史数据的问题,能够通过基于密度的聚类算法在没有投标历史数据的情况下仍能及时发现可能存在的围标串标情况,保证投标过程的公平性。过程的公平性。过程的公平性。

【技术实现步骤摘要】
基于传递步长调整的修正聚类处理方法、设备及存储介质
[0001]本申请是申请日为2021年1月20日、申请号为202110072560.8、专利技术名称为“一种基于密度聚类的投标信息处理方法、设备及存储介质”的专利技术专利申请的分案申请。


[0002]本专利技术涉及计算机
,具体涉及基于传递步长调整的修正聚类处理方法、设备及存储介质。

技术介绍

[0003]招标投标制度始于上世纪80年代,这项制度对提高工程质量、加强安全管理、控制项目成本等有着极其重要的意义。但是,在招标投标制度实施的30多年来,虚假招标、串通投标、弄虚作假骗取中标等问题一直制约招标投标制度的进一步发展。自2012年以来,“电子化”和“网络化”已成为招标投标的发展趋势。目前,在全国公共资源交易过程中每天能够产生海量的招标投标电子化“数据”,使得将“大数据”技术应用于招标投标提供了重要的前提条件。通过引入“大数据”技术,对招标投标过程中产生的各种“数据”进行有益的收集、整理、加工和利用,充分发挥“数据”在加强招标投标活动的监管中的基础性、预测性和指导性作用,将能够促进招标投标市场健康可持续发展。但是目前的大数据技术运用在招投标领域的应用并不成熟,仍存在诸多缺点,例如后台服务器进行大数据分析时对于围标串标的检测不及时、不准确。

技术实现思路

[0004]由于现有方法存在上述问题,本专利技术实施例提出基于传递步长调整的修正聚类处理方法方法、设备及存储介质。
[0005]第一方面,本专利技术实施例提出基于传递步长调整的修正聚类处理方法,包括:
[0006]获取与用户对应的测量参数,根据所述测量参数采用具有噪声的基于密度的聚类方法,根据密度可达关系计算最大密度相连的样本集合,得到的样本集合作为聚类结果;
[0007]所述聚类结果包括目标集合和噪音点,对于噪音点数据基于预定义数据集合进行修正;所述对于噪音点数据基于预定义数据集合进行修正具体为:设定默认的传递步长,并根据默认的传递步长更新目标集合;所述传递步长为密度可达关系中两个密度可达样本之间的传递样本的数量;
[0008]获取待分析的投标信息,所述投标信息包括当前招投标活动的参与用户;
[0009]根据聚类结果判断当前招投标活动的参与用户中是否存在关联关系;
[0010]删除存在关联关系的参与用户后,当前招投标活动的参与用户数量不足时,获取当前招投标活动的招标用户输入的传递步长调整参数;
[0011]根据传递步长调整参数计算新的传递步长,并根据传递步长更新目标集合;
[0012]在更新后的目标集合中除去当前招投标活动的参与用户所在的目标集合,在剩下的每个目标集合中选取一个用户作为推荐用户。
[0013]可选地,所述获取与用户对应的测量参数,根据所述测量参数采用具有噪声的基于密度的聚类方法,根据密度可达关系计算最大密度相连的样本集合,得到的样本集合作为聚类结果,具体包括:
[0014]获取用户的测量参数作为样本,若样本数量大于设定阈值则根据K空间树或球树搜索最近邻,根据所述最近邻采用欧式距离确定聚类算法中的样本距离,并根据所述样本距离和所述测量参数对用户进行聚类分析,得到聚类结果。
[0015]可选地,所述测量参数包括地区属性、企业注册资本、成立时间、行业分类、资本类型、企业类型、股东信息、员工人数和/或企业动产抵押信息。
[0016]可选地,所述预定义数据集合包括已知的关联关系数据,所述已知的关联关系数据包括用于表征两个用户之间存在关联关系的第一关联关系数据和用于表征两个用户之间不存在关联关系的第二关联关系数据。
[0017]可选地,根据预定义数据集合中的第一关联关系数据,增加传递步长,并根据传递步长更新目标集合。
[0018]可选地,根据预定义数据集合中的第二关联关系数据,减少传递步长,并根据改变后的传递步长更新目标集合。
[0019]可选地,所述传递步长设置有传递步长下限值或者传递步长减少值的上限值。
[0020]可选地,所述传递步长调整参数为步长调整值或步长调整方向。
[0021]第二方面,本专利技术实施例还提出一种电子设备,包括:
[0022]至少一个处理器;以及
[0023]与所述处理器通信连接的至少一个存储器,其中:
[0024]所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述基于传递步长调整的修正聚类处理方法。
[0025]第三方面,本专利技术实施例还提出一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机程序,所述计算机程序使所述计算机执行上述基于传递步长调整的修正聚类处理方法。
[0026]由上述技术方案可知,本专利技术实施例通过结合基于传递步长调整的修正聚类处理方法,避免了传统社团检测算法中需要企业参与投标历史数据的问题,能够通过基于密度的聚类算法在没有投标历史数据的情况下仍能及时发现可能存在的围标串标情况,保证投标过程的公平性。
附图说明
[0027]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。
[0028]图1为现有方案提供的一种社团检测算法过程的示意图;
[0029]图2为基于密度聚类的投标信息处理步骤流程示意图;
[0030]图3为本专利技术一实施例提供的一种样本聚类过程的示意图;
[0031]图4为本专利技术一实施例对于噪音点数据基于用户预定义数据集合进行修正聚类结
果的步骤流程图;
[0032]图5为本专利技术一实施例聚类结果修正前样本聚类示意图;
[0033]图6为本专利技术一实施例聚类结果修正后一样本聚类示意图;
[0034]图7为本专利技术一实施例聚类结果修正后另一样本聚类示意图;
[0035]图8为本专利技术一实施例根据预定义数据集合中的数据更新目标集合的步骤流程图;
[0036]图9为本专利技术一实施例聚类结果修正前样本聚类示意图;
[0037]图10为本专利技术一实施例中根据传递步长调整参数更新目标集合的步骤示意图;
[0038]图11为本专利技术一实施例提供的电子设备框图。
具体实施方式
[0039]下面结合附图,对本专利技术的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。
[0040]首先,目前的大数据技术运用在招投标领域的应用并不成熟,例如对于围标串标的违法活动,主要是通过历史投标大数据进行分析来发现围标串标信息,因为围标串标的参与者自然地具备社团属性,因此传统方案通常会想到采用社团检测算法来实现,其主要思想是通过历史数据分析参与招投标的企业之间是否属于同一个社团,即是否存在关联关系。参照图1所示的一种社团检本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于传递步长调整的修正聚类处理方法,其特征在于,包括:获取与用户对应的测量参数,根据所述测量参数采用具有噪声的基于密度的聚类方法,根据密度可达关系计算最大密度相连的样本集合,得到的样本集合作为聚类结果;所述聚类结果包括目标集合和噪音点,对于噪音点数据基于预定义数据集合进行修正;所述对于噪音点数据基于预定义数据集合进行修正具体为:设定默认的传递步长,并根据默认的传递步长更新目标集合;所述传递步长为密度可达关系中两个密度可达样本之间的传递样本的数量;获取待分析的投标信息,所述投标信息包括当前招投标活动的参与用户;根据聚类结果判断当前招投标活动的参与用户中是否存在关联关系;删除存在关联关系的参与用户后,当前招投标活动的参与用户数量不足时,获取当前招投标活动的招标用户输入的传递步长调整参数;根据传递步长调整参数计算新的传递步长,并根据传递步长更新目标集合;在更新后的目标集合中除去当前招投标活动的参与用户所在的目标集合,在剩下的每个目标集合中选取一个用户作为推荐用户。2.根据权利要求1所述的基于传递步长调整的修正聚类处理方法,其特征在于,所述获取与用户对应的测量参数,根据所述测量参数采用具有噪声的基于密度的聚类方法,根据密度可达关系计算最大密度相连的样本集合,得到的样本集合作为聚类结果,具体包括:获取用户的测量参数作为样本,若样本数量大于设定阈值则根据K空间树或球树搜索最近邻,根据所述最近邻采用欧式距离确定聚类算法中的样本距离,并根据所述样本距离和所述测量参数对用户进行聚类分析,得到聚类结果。3.根据权利要求1或2所述的基于传递步长调整的修正聚类处理方法,其特征...

【专利技术属性】
技术研发人员:徐丹丹张磊文辉
申请(专利权)人:国义招标股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1