一种基于文本分析的招标采购需求分析方法及系统技术方案

技术编号:39815402 阅读:13 留言:0更新日期:2023-12-22 19:33
本发明专利技术公开了一种基于文本分析的招标采购需求分析方法及系统,该方法包括:获取待分析的招标采购公告的文本;提取待分析文本的关键词,并获取关键词的类别;基于待分析文本的所有关键词对采购需求形态进行分类;在不同类别的关键词中选择至少一个类别的关键词,并对被选择的关键词进行组合,形成采购需求分析语句;将采购需求分析语句输入预设的采购需求分析模型获取采购需求特征,所述采购需求分析模型中采用注意力机制

【技术实现步骤摘要】
一种基于文本分析的招标采购需求分析方法及系统


[0001]本专利技术涉及招标采购分析
,具体涉及一种基于文本分析的招标采购需求分析方法及系统


技术介绍

[0002]全国政府机关及事业单位门户网站

政府集采网站

行业招投标平台及其他媒体,每天都要发布数万条招投标信息和中标信息

这些信息涉及到方方面面,里面也各种各样的采购需求

对于招采平台而言,及时获取这些数以万计的信息,并找到采购的真实需求的部分,做相应的处理,是极其有价值的工作,难度也比较大

一般而言,这些信息中包括了招标公司

招标类型

招标产品

联系电话

采购数量

投标结果

项目名称

截止时间

资质要求等要素点

这些信息都以非结构化或者半结构化文本的形式存在于平台的招标公告中,对它们进行分析识别后抽取里面那些真实采购需求与对应的服务,对招采平台的准确撮合推荐给相应的供应商有很大的价值,是重要的市场工作

[0003]现有技术中,只单纯的结构化需求物资的属性,存在采购需求范围大,物资不准确,需求识别不明确的问题


技术实现思路

[0004]针对上述现有技术存在的问题,本专利技术提供了一种基于文本分析的招标采购需求分析方法及系统,有效提高采购需求分析的准确性

该技术方案如下:
[0005]第一方面,提供了一种基于文本分析的招标采购需求分析方法,包括:
[0006]获取待分析的招标采购公告的文本,记为待分析文本;
[0007]提取待分析文本的关键词,并获取关键词的类别;所述关键词的类别基于预设的多个类别确定;所述预设的多个类别中包括至少一个类别表征物资特征类

至少一个类别表征物资属性类

至少一个类别表征物资服务类;
[0008]基于待分析文本的所有关键词对采购需求形态进行分类,所述采购需求形态的类别包括单态和多态;
[0009]在不同类别的关键词中选择至少一个类别的关键词,并对被选择的关键词进行组合,形成采购需求分析语句,在所述采购需求形态为单态时,被选择的关键词的类别至少包括物资特征类,在所述采购需求形态为多态时,被选择的关键词的类别至少包括物资特征类和物资服务类;
[0010]将采购需求分析语句输入预设的采购需求分析模型获取采购需求特征,所述采购需求分析模型中采用注意力机制

[0011]在一些实施方式中,所述提取待分析文本的关键词,对所述关键词进行语义识别分类,包括:
[0012]获取训练文本,所述训练文本为招标采购公告的文本;
[0013]基于训练文本,对每个字符在预设词典中进行匹配,获取至少一个匹配词;
[0014]获取每个字符在每个匹配词中的位置信息;
[0015]对字符的每个匹配词获取其对应的词特征向量;
[0016]通过匹配词的预设权重对字符的所有词特征向量进行加权融合,获取字符的融合词特征向量;
[0017]获取字符的特征向量,并将字符的特征向量和字符的融合词特征向量连接后作为字符表示特征,将所述训练文本中的所有的字符表示特征输入到预设的第一神经网络中,以训练文本对应的预设类别关键词的位置和关键词类别标注数据训练所述预设的第一神经网络,基于训练完成的预设的第一神经网络作为关键词识别模型;
[0018]对待分析文本,利用预设词典获取待分析文本中每个字符的字符表示特征;
[0019]将待分析文本的所有的字符表示特征输入到关键词识别模型中,获取待分析文本的关键词及关键词的类别

[0020]在一些实施方式中,所述匹配词的词特征向量的获取方法为:
[0021]将预设词典中的词语按照同义词或者近义词分为一小类,同时根据词语的语义类别将多个小类合并为一大类;
[0022]对每个大类进行独热编码获取第一编码值,在每个大类中依次对每个小类进行独热编码获取第二编码值,在每个小类中依次对每个词语进行独热编码获取第三编码值,基于所述第一编码值

第二编码值

第三编码值拼接确定每个词语的编码值;
[0023]将词语的编码值输入到预设的第二神经网络中,以词语的上下文词语的编码值为目标输出训练所述第二神经网络,基于训练完成的第二神经网络的权重参数作为词语的词特征向量;
[0024]所述字符的特征向量的获取方法为:
[0025]基于字符的匹配词的个数

匹配词的出现次数和每个匹配词的词特征向量确定每个字符的特征向量

[0026]在一些实施方式中,关键词的所述预设的多个类别包括:项目
/
物资

设备

型号

厂家

数量和服务类型

[0027]在一些实施方式中,所述在不同类别的关键词中选择至少一个类别的关键词,并对被选择的关键词进行组合,形成采购需求分析语句,包括:
[0028]基于被选择的至少一个类别的至少一个关键词,按照物资属性类

物资特征类

物资服务类的顺序进行组合,形成采购需求分析语句

[0029]在一些实施方式中,所述将采购需求分析语句输入预设的采购需求分析模型获取采购需求特征,包括:
[0030]对采购需求分析语句中的所有关键词分别进行编码获取词向量,形成词向量序列;
[0031]通过注意力机制获取词向量序列中词向量之间的依赖性特征,将所述依赖性特征融合到所述词向量序列,获取融合词向量序列;
[0032]基于融合词向量序列利用采购需求分析模型中的第三神经网络获取采购需求特征表示

[0033]在一些实施方式中,所述通过注意力机制获取词向量序列中词向量之间的依赖性特征
,
包括:
[0034]获取任意的词向量与词向量序列中剩余词向量的位置距离;
[0035]获取任意的词向量与词向量序列中剩余词向量的相关性,所述相关性表征两个词向量出现的同步性;
[0036]基于所述位置距离和相关性确定词向量确定第一关联性特征;
[0037]基于任意的词向量与词向量序列中剩余词向量的差异确定第二关联性特征;
[0038]基于第一关联性特征和第二关联性特征获取关联性矩阵;
[0039]利用
Softmax
函数对关联性矩阵和关联性矩阵的转置分别进行处理获取任意的词向量对词向量序列中剩余词向量的注意力得分和词向量序列中剩余词向量对任意的词向量的注意力得分;
[0040]基于任意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于文本分析的招标采购需求分析方法,其特征在于,包括:获取待分析的招标采购公告的文本,记为待分析文本;提取待分析文本的关键词,并获取关键词的类别;所述关键词的类别基于预设的多个类别确定;所述预设的多个类别中包括至少一个类别表征物资特征类

至少一个类别表征物资属性类

至少一个类别表征物资服务类;基于待分析文本的所有关键词对采购需求形态进行分类,所述采购需求形态的类别包括单态和多态;在不同类别的关键词中选择至少一个类别的关键词,并对被选择的关键词进行组合,形成采购需求分析语句,在所述采购需求形态为单态时,被选择的关键词的类别至少包括物资特征类,在所述采购需求形态为多态时,被选择的关键词的类别至少包括物资特征类和物资服务类;将采购需求分析语句输入预设的采购需求分析模型获取采购需求特征,所述采购需求分析模型中采用注意力机制
。2.
根据权利要求1所述的一种基于文本分析的招标采购需求分析方法,其特征在于,所述提取待分析文本的关键词,对所述关键词进行语义识别分类,包括:获取训练文本,所述训练文本为招标采购公告的文本;基于训练文本,对每个字符在预设词典中进行匹配,获取至少一个匹配词;获取每个字符在每个匹配词中的位置信息;对字符的每个匹配词获取其对应的词特征向量;通过匹配词的预设权重对字符的所有词特征向量进行加权融合,获取字符的融合词特征向量;获取字符的特征向量,并将字符的特征向量和字符的融合词特征向量连接后作为字符表示特征,将所述训练文本中的所有的字符表示特征输入到预设的第一神经网络中,以训练文本对应的预设类别关键词的位置和关键词类别标注数据训练所述预设的第一神经网络,基于训练完成的预设的第一神经网络作为关键词识别模型;对待分析文本,利用预设词典获取待分析文本中每个字符的字符表示特征;将待分析文本的所有的字符表示特征输入到关键词识别模型中,获取待分析文本的关键词及关键词的类别
。3.
根据权利要求2所述的一种基于文本分析的招标采购需求分析方法,其特征在于,所述匹配词的词特征向量的获取方法为:将预设词典中的词语按照同义词或者近义词分为一小类,同时根据词语的语义类别将多个小类合并为一大类;对每个大类进行独热编码获取第一编码值,在每个大类中依次对每个小类进行独热编码获取第二编码值,在每个小类中依次对每个词语进行独热编码获取第三编码值,基于所述第一编码值

第二编码值

第三编码值拼接确定每个词语的编码值;将词语的编码值输入到预设的第二神经网络中,以词语的上下文词语的编码值为目标输出训练所述第二神经网络,基于训练完成的第二神经网络的权重参数作为词语的词特征向量;所述字符的特征向量的获取方法为:
基于字符的匹配词的个数

匹配词的出现次数和每个匹配词的词特征向量确定每个字符的特征向量
。4.
根据权利要求1所述的一种基于文本分析的招标采购需求分析方法,其特征在于,关键词的所述预设的多个类别包括:项目
/
物资

设备

型号

厂家

数量和服务类型
。5.
根据权利要求1...

【专利技术属性】
技术研发人员:卢晓凯封军姚丽高俊
申请(专利权)人:安徽省优质采科技发展有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1