【技术实现步骤摘要】
一种招标书的需求类别处理方法、装置、设备及存储介质
[0001]本专利技术涉及计算机
,尤其涉及一种招标书的需求类别处理方法
、
装置
、
设备及存储介质
。
技术介绍
[0002]由于招标书通常直接给出具体的招标需求文本,如“项目经理需要3年以上工作经验”,但不会写明招标需求文本所属的招标需求类别,如“项目人员要求”。
[0003]因此在招标书的文本处理任务中,通常会涉及到招标需求类别的解读步骤,该步骤主要通过对多个招标书中的招标需求文本进行聚类,从聚类结果的整体上分析多个招标书所涉及到的招标需求类别,以便为后续指定招标书的招标需求文本的提取
、
投标书的匹配
、
投标书的文本生成等场景应用提供数据支撑
。
[0004]目前,上述招标需求文本的聚类操作依赖于文本相似度算法实现
。
但即便是在同一招标书中,针对同一招标需求类别,也经常会出现文本内容相差很大的两种招标需求文本,如同样针对“项目人员要求”,招标需求文本可能是“项目经理需要3年以上工作经验”,也可能是“工程师需要具备工程类证书”。
因此高度依赖文本内容的文本相似度算法与招标需求文本的适配性并不高,从而使得对招标书的招标需求类别的解读准确度不高
。
技术实现思路
[0005]本专利技术实施例提供了一种招标书的需求类别处理方法
、
装置
、
设备及存储介质,以解决文本相似度算法与目 ...
【技术保护点】
【技术特征摘要】
1.
一种招标书的需求类别处理方法,其特征在于,包括:获取至少两个招投标数据分别对应的至少一个招投标文本组合;其中,所述招投标数据中包含成对匹配的招标书和投标书,所述招投标文本组合中包含所述招标书中的招标文本和所述投标书中的投标文本;获取每个招投标文本组合中的投标文本响应招标文本的响应匹配度;针对任意两个招投标数据,获取两个招投标数据分别对应的投标文本之间的投标文本相似度;根据两个招投标数据分别对应的至少一个响应匹配度以及两个招投标数据对应的至少一个投标文本相似度,确定两个招投标数据分别对应的招标文本之间的招标需求关联度;基于至少一个招标需求关联度,对各所述招投标数据中的各招标文本进行聚类得到招标文本聚类集的招标需求类别
。2.
根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述招标文本聚类集中的各招标文本以及与所述招标文本聚类集的招标需求类别作为训练样本;基于所述训练样本,对初始需求类别识别模型进行训练得到训练完成的目标需求类别识别模型
。3.
根据权利要求2所述的方法,其特征在于,所述方法还包括:将待测招标书中的至少一个待测招标文本分别输入训练完成的目标需求类别识别模型,以输出至少一个目标招标文本以及各所述目标招标文本分别对应的目标招标需求类别;基于各所述目标招标文本和各所述目标招标需求类别分别对应的参考投标标题框架,生成至少一个投标生成提示语;将至少一个投标生成提示语输入通用领域语言模型,以输出至少一个目标投标文本内容;根据各所述目标投标文本内容,生成与所述待测招标书对应的目标投标书
。4.
根据权利要求1所述的方法,其特征在于,所述方法还包括:根据至少两个招投标文本组合,构建招投标关联图;其中,所述招投标关联图中的节点代表招标文本和投标文本;相应的,所述根据两个招投标数据分别对应的至少一个响应匹配度以及两个招投标数据对应的至少一个投标文本相似度,确定两个招投标数据分别对应的招标文本之间的招标需求关联度,包括:将所述响应匹配度作为所述招投标关联图中每个招投标数据中的招标文本和投标文本之间的边路径权重,将所述投标文本相似度作为任意两个招投标数据分别对应的投标文本之间的边路径权重;从两个招投标数据中的第一招标书中获取第一招标文本以及从两个招投标数据中的第二招标书中获取第二招标文本;从所述招投标关联图中查找与所述第一招标文本和所述第二招标文本对应的至少一条招标路径;
基于各所述招标路径分别对应的三个边路径权重,确定第一招标文本和第二招标文本之间的招标需求关联度
。5.
根据权利要求4所述的方法,其特征在于,所述基于各所述招标路径分别对应的三个边路径权重,确定第一招标文本和第二招标文本之间的招标需求关联度,包括:针对每个招标路径,将所述招标路径中三个边路径权重的乘积作为所述招标路径对应的路径相似度;基于各所述路径相似度对应的统计值作为所述第一招标文本和第二招标文本对应的招标需求关联度
。6.
根据权利要求1所述的方法,其特征在于,所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。