System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种项目物资招标的智能分标方法、系统、设备及介质技术方案_技高网

一种项目物资招标的智能分标方法、系统、设备及介质技术方案

技术编号:41139005 阅读:5 留言:0更新日期:2024-04-30 18:09
本发明专利技术公开了一种项目物资招标的智能分标方法、系统、设备及介质,先通过预设的BERT模型完成文本的语义表示和预处理,高效地学习文本的语义信息,提高类别划分的准确率;然后通过BERT模型对描述文本进行初步分类,得到一个父类别标签,将该父类别标签与对应的描述文本进行融合作为下一层的输入,来预测子类别标签,有效提高分类的准确性和效率,通过BERT模型将子类别标签与描述文本进行组合,将上一层网络训练得到的最优权重参数加载到本层网络中,使得本层分类结果带有上一层标签分类结果的特性,提高类别标签预测准确性;最后通过最小哈希算法实现标段合并,解决由于标段预投资金额不足而招标困难的问题,提高项目招标的成功率。

【技术实现步骤摘要】

本专利技术涉及智能分标,尤其是涉及一种项目物资招标的智能分标方法、系统、设备及介质


技术介绍

1、目前,经济的增长正促使社会发展产生变革。为能够顺应人工智能、大数据、区块链等先进科技与产业融合创新的新趋势,各行业积极推进“互联网+招标采购”,致力于建设和发展电子招投标及其信息一体化共享体系。在招投标领域中,标段划分是招标策划的首要工作,项目的分标方案直接关系到后续所有招投标相关工作的展开,同时也是招标文件的关键构成部分,为评标定标提供了必要的基础和依据。在实际的工程项目招标中,标段划分是一个非常重要的环节,标段的划分对整个工程项目的实施和完成都有着至关重要的作用和影响。只有科学、合理、合法的标段划分才能保证工程项目顺利实施和高质量完成。因此,在实际的招标过程中,必须注重标段划分的科学合理性。

2、传统电网建设项目物资招标的分标工作通常由人工完成,这种方式既耗费大量人力物力,又容易出错。不合理的分标方案不仅会阻碍项目建设的推进,而且对于不同标段的承包方,可能会造成设备或场地资源冲突的问题,进一步增加了项目建设过程中的协调管理难度。因此,亟需通过人工智能相关技术来实现智能分标,完善电子招投标系统的建立,促进达成招投标业务降本增效。


技术实现思路

1、本专利技术旨在至少解决现有技术中存在的技术问题之一。为此,本专利技术提出一种项目物资招标的智能分标方法、系统、设备及介质,能够通过分析招标方物资采购清单,基于采购物资的描述文本进行层次化类别标签分类,并计算预投资金额不足标段之间的采购物资内容相似度,合并同类的相关标段,最终实现标段划分。

2、第一方面,本专利技术的实施例提供了一种项目物资招标的智能分标方法,包括:

3、获取每个招标项目的物资采购集合,所述物资采购集合中每个元素对应一个物资,每个所述物资具有对应的描述文本;

4、将所述描述文本输入预设的bert模型,得到具有父类标签的第一特征向量;

5、将所述第一特征向量输入预设的全连接网络,得到所述父类标签对应的父类标签分类结果;将所述父类标签分类结果和所述描述文本联合嵌入所述bert模型,得到具有第一子类标签的第二特征向量;将所述第二特征向量输入所述全连接网络,得到所述第一子类标签对应的第一子类标签分类结果;将所述第一子类标签分类结果与所述描述文本联合嵌入所述bert模型,得到具有第二子类标签的第三特征向量;将所述第三特征向量输入所述全连接网络,得到所述第二子类标签对应的第二子类标签分类结果;循环迭代直到得到第n子类标签对应的第n子类标签分类结果,其中,n表示预设的子类标签数量阈值;

6、计算所述第n子类标签分类结果中每个标段的预投资金额,并标注所述预投资金额小于金额阈值的所述标段得到待合并标段;

7、筛选与每个所述待合并标段同一第n-1子类标签下大于或等于所述金额阈值的候选标段;

8、根据最小哈希算法计算每个所述待合并标段与对应的所述候选标段的所述第n子类标签之间的相似度,并根据所述相似度合并标段,得到最终分标结果。

9、根据本专利技术实施例的方法,至少具有如下有益效果:

10、首先通过预设的bert模型完成文本的语义表示和预处理,bert模型能够高效地学习文本的语义信息,提高物资类别划分的准确率;然后通过bert模型对描述文本进行初步分类,得到一个父类别标签,其次将该父类别标签与对应的描述文本进行融合,作为下一层的输入,以此来预测子类别标签,重复迭代,直到达到子类标签数量阈值,可以有效地提高分类的准确性和效率,因为通过层次化标签将分类问题分解成多个子问题,每个子问题的难度都较小,更容易解决。同时,还充分利用了文本的层次结构特点,将文本的类别标签分解成多个层次,从而更加准确地描述文本的类别特征,最重要的是,通过bert模型将子类别标签与描述文本进行组合,由于类别标签与描述文本之间存在一定的关系,因此考虑类别标签之间的结构关系可以提高分类的效果,将上一层网络训练得到的最优权重参数加载到本层网络中,使得本层分类结果带有上一层标签分类结果的特性,提高类别标签预测准确性;最后通过最小哈希算法实现标段合并,能够计算预投资金额不足标段之间的采购物资内容相似度,合并同类的相关标段,最终实现标段划分,可以有效解决传统分标中由于标段预投资金额不足而招标困难的问题,有利于提高项目招标的成功率。

11、根据本专利技术的一些实施例,所述bert模型由多个transformer中的编码器堆叠组成,所述编码器用于对输入文本进行词嵌入、段嵌入和位置嵌入。

12、根据本专利技术的一些实施例,所述预设的bert模型通过以下步骤进行预训练得到:

13、获取无标签文本数据;

14、将所述无标签文本数据切割成多个第一片段;

15、将每个所述第一片段通过掩膜遮盖部分标记,得到第二片段;

16、将所述第二片段输入所述bert模型进行训练,直到所述bert模型收敛得到所述预设的bert模型;其中,所述bert模型的训练过程包括执行标记掩码语言模型任务以预测所述掩膜遮盖的标记以及执行下一句预测任务以预测语句顺序的语义关系。

17、根据本专利技术的一些实施例,所述全连接网络由多层感知器网络和双层激活函数组成;所述多层感知器网络包括输入层、隐藏层和输出层,所述隐藏层包括多个神经元,每个所述神经元均代表一个全连接层,所述双层激活函数的第一层为线性整流函数,所述双层激活函数的第二层为归一化指数函数。

18、根据本专利技术的一些实施例,所述根据最小哈希算法计算每个所述待合并标段与对应的所述候选标段的所述第n子类标签之间的相似度,包括以下步骤:

19、通过哈希函数将所述待合并标段和所述候选标段中所述第n子类标签的元素位置进行随机打乱,得到所述待合并标段对应的多个第一元素集合和所述候选标段对应的多个第二元素集合;

20、将每个所述第一元素集合中的第一个元素作为所述第一元素集合的特征值,得到第一特征矩阵,并将每个所述第二元素集合中的第一个元素作为所述第二元素集合的特征值,得到第二特征矩阵;

21、随机打乱所述第一特征矩阵和所述第二特征矩阵,得到所述第一特征矩阵对应的多个第一最小哈希值和所述第二特征矩阵对应的第二最小哈希值;

22、计算所述第一最小哈希值和所述第二最小哈希值之间的相等概率,得到所述相似度。

23、根据本专利技术的一些实施例,所述计算所述第一最小哈希值和所述第二最小哈希值之间的相等概率,得到所述相似度,包括以下步骤:

24、将多个所述第一最小哈希值作为第一哈希值集合,并将多个所述第二最小哈希值作为第二哈希值集合;

25、通过jaccard系数计算所述第一哈希值集合和所述第二哈希值集合之间的最小哈希相等概率;

26、将所述最小哈希相等概率转化为所述相似度。

27、根据本专利技术的一些实施例,所述根据所述相似度合并标段,得到最终分标结果,包括本文档来自技高网...

【技术保护点】

1.一种项目物资招标的智能分标方法,其特征在于,所述项目物资招标的智能分标方法包括:

2.根据权利要求1所述的项目物资招标的智能分标方法,其特征在于,所述BERT模型由多个Transformer中的编码器堆叠组成,所述编码器用于对输入文本进行词嵌入、段嵌入和位置嵌入。

3.根据权利要求2所述的项目物资招标的智能分标方法,其特征在于,所述预设的BERT模型通过以下步骤进行预训练得到:

4.根据权利要求1所述的项目物资招标的智能分标方法,其特征在于,所述全连接网络由多层感知器网络和双层激活函数组成;所述多层感知器网络包括输入层、隐藏层和输出层,所述隐藏层包括多个神经元,每个所述神经元均代表一个全连接层,所述双层激活函数的第一层为线性整流函数,所述双层激活函数的第二层为归一化指数函数。

5.根据权利要求1所述的项目物资招标的智能分标方法,其特征在于,所述根据最小哈希算法计算每个所述待合并标段与对应的所述候选标段的所述第N子类标签之间的相似度,包括以下步骤:

6.根据权利要求5所述的项目物资招标的智能分标方法,其特征在于,所述计算所述第一最小哈希值和所述第二最小哈希值之间的相等概率,得到所述相似度,包括以下步骤:

7.根据权利要求6所述的项目物资招标的智能分标方法,其特征在于,所述根据所述相似度合并标段,得到最终分标结果,包括如下步骤:

8.一种项目物资招标的智能分标方法系统,其特征在于,所述项目物资招标的智能分标方法系统包括:

9.一种电子设备,其特征在于:包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如权利要求1至7任一项所述的项目物资招标的智能分标方法。

10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至7任一项所述的项目物资招标的智能分标方法。

...

【技术特征摘要】

1.一种项目物资招标的智能分标方法,其特征在于,所述项目物资招标的智能分标方法包括:

2.根据权利要求1所述的项目物资招标的智能分标方法,其特征在于,所述bert模型由多个transformer中的编码器堆叠组成,所述编码器用于对输入文本进行词嵌入、段嵌入和位置嵌入。

3.根据权利要求2所述的项目物资招标的智能分标方法,其特征在于,所述预设的bert模型通过以下步骤进行预训练得到:

4.根据权利要求1所述的项目物资招标的智能分标方法,其特征在于,所述全连接网络由多层感知器网络和双层激活函数组成;所述多层感知器网络包括输入层、隐藏层和输出层,所述隐藏层包括多个神经元,每个所述神经元均代表一个全连接层,所述双层激活函数的第一层为线性整流函数,所述双层激活函数的第二层为归一化指数函数。

5.根据权利要求1所述的项目物资招标的智能分标方法,其特征在于,所述根据最小哈希算法计算每个所述待合并标段与对应的所述候选标段的所述第n子类标签之间的相似度,包括以下步骤...

【专利技术属性】
技术研发人员:吴小忠侯继辉姚欢李翾刘巍夏卓群梁涤青徐嘉慧邱涵
申请(专利权)人:湖南湘能创业项目管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1