System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于知识图谱的招投标数据分析方法、系统及介质技术方案_技高网

一种基于知识图谱的招投标数据分析方法、系统及介质技术方案

技术编号:41208441 阅读:3 留言:0更新日期:2024-05-09 23:30
本发明专利技术请求保护一种基于知识图谱的招投标数据分析方法、系统及介质,涉及对招标公告、中标公告、投标人信息、招标人信息等数据进行收集、清洗、实体关系提取、知识图谱构建等一系列步骤,以及利用图数据库进行数据分析和推荐的方法。其包括以下步骤:S1,首先获取招投标数据,并对获取的招投标数据进行去除冗余、去噪在内、标签生成在内的预处理;S2,采用非关系数据库NoSQL构建招投标项目知识图谱,生成招投标数据评分集;S3,根据招投标基础特征,构建MHARN‑DIN深度学习推荐模型并进行训练,所述MHARN‑DIN深度学习推荐模型是在原始DIN模型的基础上引入多头注意力和残差网络机制;S4,根据MHARN‑DIN深度学习推荐模型对候选项目进行项目推荐并存入关系型数据库中。

【技术实现步骤摘要】

本专利技术涉及涉及一种基于知识图谱的招投标数据分析方法,具体地说,涉及对招标公告、中标公告、投标人信息、招标人信息等数据进行收集、清洗、实体关系提取、知识图谱构建等一系列步骤,以及利用图数据库进行数据分析和推荐的方法。


技术介绍

1、招投标是公共资源交易的重要形式之一,已经成为政府采购、国有企业采购、工程建设、物资采购等领域的重要手段。招投标过程中产生的数据量巨大,包括招标公告、中标公告、投标人信息、招标人信息等数据,这些数据中包含了大量的信息,包括投标人的背景信息、中标公司的业绩和信誉、招标单位的采购需求等,这些信息对某些领域具有重要的意义。

2、然而,由于这些数据量大、格式不规范、信息冗余等问题,传统的分析方法往往难以充分发挥这些信息的价值。因此,基于知识图谱的招投标数据分析方法应运而生,具有更高的效率和准确性。

3、本专利旨在解决企业内部通过招投标数据定向分析以及智能推荐的方法。


技术实现思路

1、针对现有技术中所存在的不足,本专利技术提供的基于基于知识图谱的招投标数据分析方法,实现了基于招投标数据的知识图谱构建与评分集生成,并通过阿里深度兴趣网络(din)融合多头注意力机制与残差网络的深度学习推荐模型来实现企业内部招投标信息的智能推荐。

2、第一方面,本专利技术通过爬虫技术从互联网上获取了大量的招投标数据,并通过自然语言处理技术对数据进行处理,提取实体和关系,构建知识图谱。对知识图谱进行了评分集生成,得到了招投标数据的评分集。这些评分集可以帮助企业更好地了解招投标数据中的关联和规律。

3、第二方面,本专利技术结合阿里din深度兴趣网络、多头注意力机制与参差网络提出了关于招投标深度学习网络模型。以原始din模型用户打分情况、用户特征、场景特征等为基础,主要基于用户偏好特征进行训练,结合招投标的信息特征、招投标评分方案,将这些特征输入到模型中进行训练,可以得到最终的推荐列表。在原始din模型的基础上引入多头注意力和残差网络机制,保证特征信息的完整性和特征训练偏好权值计算的科学性,进一步提高兴趣深度模型的推荐精度,形成mharn-din模型。

本文档来自技高网...

【技术保护点】

1.一种基于知识图谱的招投标数据分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于知识图谱的招投标数据分析方法,其特征在于,所述步骤S1获取招投标数据的方式包括:通过网络爬虫技术来获取各大招投标网站公开数据,也可以或通过合法渠道获取的招投标数据进行导入处理;所述招投标数据包含招投标主体的主体名称、统一社会信用代码、交易数、交易金额、企业注册属地、企业经营地址、法定代表人姓名以及主体近段时间参与的招投标项目信息,数据存储固定位置。

3.根据权利要求1所述的一种基于知识图谱的招投标数据分析方法,其特征在于,所述标签生成的步骤具体包括:使用分词工具对清洗后的招投标项目名称进行分词,并对分词词频进行排序计算,生成招投标主体的五大匹配项目标签,所提取的特征将作为后期知识图谱构建中的标签实体,参与节点相似度的计算;

4.根据权利要求1所述的一种基于知识图谱的招投标数据分析方法,其特征在于,所述步骤S2采用非关系数据库NoSQL构建招投标项目知识图谱,具体包括:

5.根据权利要求4所述的一种基于知识图谱的招投标数据分析方法,其特征在于,所述GDS中的相似度计算算法具体包括:

6.根据权利要求1所述的一种基于知识图谱的招投标数据分析方法,其特征在于,所述MHARN-DIN模型的训练特征由候选项目、用户偏好、用户画像、项目画像组成,候选项目和用户偏好项目会被输入到多头注意力模块进行注意力权重的分配;。多头注意力模块中的激活单元分别对候选项目和用户偏好项目进行Dense函数及Embedding化,再对Embedding后的当前候选项目做压平,复制操作后与Embedding后的用户偏好项目做差与点积,最后再将差、点积、Embedding后的候选项目和Embedding后的用户偏好项目进行相连。

7.一种基于知识图谱的招投标数据分析系统,其特征在于,包括:

8.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述基于知识图谱的招投标数据分析方法。

9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于知识图谱的招投标数据分析方法。

10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于知识图谱的招投标数据分析方方法。

...

【技术特征摘要】

1.一种基于知识图谱的招投标数据分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于知识图谱的招投标数据分析方法,其特征在于,所述步骤s1获取招投标数据的方式包括:通过网络爬虫技术来获取各大招投标网站公开数据,也可以或通过合法渠道获取的招投标数据进行导入处理;所述招投标数据包含招投标主体的主体名称、统一社会信用代码、交易数、交易金额、企业注册属地、企业经营地址、法定代表人姓名以及主体近段时间参与的招投标项目信息,数据存储固定位置。

3.根据权利要求1所述的一种基于知识图谱的招投标数据分析方法,其特征在于,所述标签生成的步骤具体包括:使用分词工具对清洗后的招投标项目名称进行分词,并对分词词频进行排序计算,生成招投标主体的五大匹配项目标签,所提取的特征将作为后期知识图谱构建中的标签实体,参与节点相似度的计算;

4.根据权利要求1所述的一种基于知识图谱的招投标数据分析方法,其特征在于,所述步骤s2采用非关系数据库nosql构建招投标项目知识图谱,具体包括:

5.根据权利要求4所述的一种基于知识图谱的招投标数据分析方法,其特征在于,所述gds中的相似度计算算法具体包括:

6.根据权利要求1所述的一种基于知识图谱的招投...

【专利技术属性】
技术研发人员:杨桦李文艳陈益刘卫民李振乾
申请(专利权)人:重庆市信息通信咨询设计院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1