一种基于漏斗模型和余弦算法的中标项目检索方法技术

技术编号:34370300 阅读:45 留言:0更新日期:2022-07-31 10:49
本发明专利技术公开了一种基于漏斗模型和余弦算法的中标项目检索方法,通过本发明专利技术,结合现有的海量项目数据,可实现对招标、中标两个环节中零散的数据进行关联,得到一个项目基本的生命链,还可以依据关联后的链式数据进一步计算得出中标项目的下浮率,帮助用户精准投标,也能依据下浮率数据统计对招投标市场进行宏观分析或单个项目分析;可对一个项目周期内的各项数据维度,如:建设规模、招标范围、资格要求、开标时间等进行补充,完善项目信息。完善项目信息。完善项目信息。

A successful project retrieval method based on funnel model and cosine algorithm

【技术实现步骤摘要】
一种基于漏斗模型和余弦算法的中标项目检索方法


[0001]本专利技术涉及中标项目检索领域,尤其涉及一种基于漏斗模型和余弦算法的中标项目检索方法。

技术介绍

[0002]目前行业普遍没有完善的项目全周期数据,且国家对于各类招投标数据的管理目标也是在逐步精准化、整体化。而这类数据对招投标从业者又极为重要,它能够打破项目实施前最大的两个数据孤岛,让整个项目周期数据能够精准闭环。

技术实现思路

[0003]针对上述问题,本专利技术提供一种基于漏斗模型和余弦算法的中标项目检索方法。
[0004]本专利技术通过以下技术方案实现:一种基于漏斗模型和余弦算法的中标项目检索方法,包括以下步骤:S1. 根据中标项目的项目名称全匹配招标项目的项目名称,并判断结果,若结果为空,则执行步骤S2;S2. 对中标项目进行模糊匹配,将分词处理后的词库与招标项目的招标名称做减词包含查询,并判断结果,若结果为包含查询有返回,则执行步骤S3,若结果为包含查询无返回,则从末尾减词继续查询;S3. 判断招标项目的正文是否包含业主单位名称,若结果为包含,则执行步骤S4;S4. 判断招标项目的正文是否包含减词包含查询中被删减的词句,若结果为包含,则关联成功,若结果为不包含,则执行步骤S5;S5. 判断被删减的词句和招标项目的正文是否包含关键词:标段、包,并判断招标项目的项目名称和中标项目的项目名称是否包含减词包含查询中未删减的词句,若结果均为是,则执行步骤S6;S6. 根据余弦算法获取中标项目的项目名称与减词包含查询中未删减的词句的匹配度,判断结果,提取关联成功结果。
[0005]进一步的,还包括步骤S0,预先取出待检索关联的相关中标数据,其包含项目名称、业主单位和中标时间,所述中标项目的业主单位非空。
[0006]进一步的,步骤S1中判断中标项目的业主单位是否与匹配结果的业主单位互相包含具体包括以下子步骤:S101. 判断中标项目的业主单位是否与匹配结果的业主单位互相包含,若包含,则执行步骤S102,若不是,则表示关联成功;S102. 判断中标项目的中标时间和招标项目的招标截止时间是否小于一个月,若是,则执行步骤S2,若否,则表示关联成功。进一步的,所述步骤S2具体包括以下子步骤:S201. 进行模糊匹配,对中标项目和招标项目进行关键词处理;
S202. 对经过关键词处理后的中标项目的项目名称进行分词处理;S203. 将得到分词处理后的词库与招标项目的对招标名称做减词包含查询,并判断结果,若结果为包含查询有返回,则执行步骤S3,若结果为包含查询无返回,则从末尾减词继续查询。
[0007]进一步的,所述步骤S201中关键词处理具体包括以下子步骤:S2011. 将中标项目的项目名称和招标项目的项目名称中的英文括号替换为中文括号;S2012. 删去中标项目的名称中的关键词:项目名称、项目编号、不分标段、招标项目。
[0008]进一步的,所述步骤S202中分词处理的具体步骤为:将关键词处理后的中标项目的项目名称和招标项目的项目名称进行IK智能分词。
[0009]进一步的,所述步骤S203具体包括以下子步骤:S2031. 将分词处理后的词库与招标项目的招标名称做减词包含查询,当搜索词小于4个时,则表示关联失败,当搜索词大于4个时,则执行步骤S2032;S2032. 判断包含查询结果,当结果为包含查询有返回,则执行步骤S3,当结果为包含查询无返回,则从末尾减词继续查询。
[0010]进一步的,所述步骤S5中,若结果有其一为否,则判断减词包含查询中被删减的词句是否包含关键词。
[0011]进一步的,所述步骤S5中判断减词包含查询中被删减的词句是否包含关键词具体包括以下步骤:S501. 判断减词包含查询中被删减的词句是否包含关键词:联合体、标段、监理、设计、总承包,并判断招标项目的项目名称是否包含减词包含查询中未删减的词句,若否,则判断减词包含查询中被删减的词句是否为空,若是,则执行步骤S502;S502. 通过余弦算法获取中标项目的项目名称与减词包含查询中未删减的词句的匹配度,当匹配度小于60%时,则执行步骤S503;当匹配度大于60%时,则表示关联成功;S503. 判断替换后的中标项目的项目名称与招标项目的项目名称的匹配度,当匹配度小于94%时,则执行步骤S504,当匹配度大于94%时,则表示关联成功;S504. 判断招标项目的正文是否包含减词包含查询中被删减的词句,若结果为否,则表示关联失败,若结果为是,则表示关联成功。
[0012]进一步的,所述步骤S6具体包括以下子步骤:S601. 根据余弦算法获取中标项目的项目名称与减词包含查询中未删减的词句的匹配度,判断匹配度,当匹配度小于60% 时,则执行步骤S602,当匹配度大于60%时,则表示关联成功;S602. 判断替换后的中标项目的项目名称与招标项目的项目名称的匹配度,判断匹配度,当匹配度小于94% 时,则执行步骤S603,当匹配度大于94%时,则表示关联成功;S603. 判断招标项目的正文是否包含减词包含查询中被删减的词句,若结果为否,则表示关联失败,若结果为是,则表示关联成功。
[0013]本专利技术的有益效果:(1)通过本专利技术,结合现有的海量项目数据,可实现对招标、中标两个环节中零散
的数据进行关联,得到一个项目基本的生命链,还可以依据关联后的链式数据进一步计算得出中标项目的下浮率,帮助用户精准投标,也能依据下浮率数据统计对招投标市场进行宏观分析或单个项目分析;(2)本专利技术可对一个项目周期内的各项数据维度,如:建设规模、招标范围、资格要求、开标时间等进行补充,完善项目信息;(3)本专利技术可以通过大数据分析出业主单位和中标单位的招投标趋势等重要参考信息;(4)本专利技术提供了一种项目全生命周期信息管理的技术方案。
附图说明
[0014]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0015]图1为本专利技术实施例提出的一种基于漏斗模型和余弦算法的中标项目检索方法的方法流程图;图2为本专利技术实施例提出的一种基于漏斗模型和余弦算法的中标项目检索方法的终端设备的结构示意图;图3为本专利技术实施例提出的一种基于漏斗模型和余弦算法的中标项目检索方法的计算机可读存储介质结构示意图。
具体实施方式
[0016]为使本专利技术的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本专利技术作进一步的详细说明,本专利技术的示意性实施方式及其说明仅用于解释本专利技术,并不作为对本专利技术的限定。
[0017]实施例1如图1,本实施例提出一种基于漏斗模型和余弦算法的中标项目检索方法,包括以下步骤:一种基于漏斗模型和余弦算法的中标项目检索方法,包括以下步骤:S1. 根据中标项目的项目名称全匹配招标项目的项目名称,并判断结果,若结果为空,则执行步骤S2;S2. 对中标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于漏斗模型和余弦算法的中标项目检索方法,其特征在于,包括以下步骤:S1. 根据中标项目的项目名称全匹配招标项目的项目名称,并判断结果,若结果为空,则执行步骤S2;S2. 对中标项目进行模糊匹配,将分词处理后的词库与招标项目的招标名称做减词包含查询,并判断结果,若结果为包含查询有返回,则执行步骤S3,若结果为包含查询无返回,则从末尾减词继续查询;S3. 判断招标项目的正文是否包含业主单位名称,若结果为包含,则执行步骤S4;S4. 判断招标项目的正文是否包含减词包含查询中被删减的词句,若结果为包含,则关联成功,若结果为不包含,则执行步骤S5;S5. 判断被删减的词句和招标项目的正文是否包含关键词:标段、包,并判断招标项目的项目名称和中标项目的项目名称是否包含减词包含查询中未删减的词句,若结果均为是,则执行步骤S6;S6. 根据余弦算法获取中标项目的项目名称与减词包含查询中未删减的词句的匹配度,判断结果,提取关联成功结果。2.根据权利要求1所述的一种基于漏斗模型和余弦算法的中标项目检索方法,其特征在于,还包括步骤S0,预先取出待检索关联的相关中标数据,其包含项目名称、业主单位和中标时间,所述中标项目的业主单位非空。3.根据权利要求1所述的一种基于漏斗模型和余弦算法的中标项目检索方法,其特征在于,步骤S1中判断中标项目的业主单位是否与匹配结果的业主单位互相包含具体包括以下子步骤:S101. 判断中标项目的业主单位是否与匹配结果的业主单位互相包含,若包含,则执行步骤S102,若不是,则表示关联成功;S102. 判断中标项目的中标时间和招标项目的招标截止时间是否小于一个月,若是,则执行步骤S2,若否,则表示关联成功。4.根据权利要求1所述的一种基于漏斗模型和余弦算法的中标项目检索方法,其特征在于,所述步骤S2具体包括以下子步骤:S201. 进行模糊匹配,对中标项目和招标项目进行关键词处理;S202. 对经过关键词处理后的中标项目的项目名称进行分词处理;S203. 将得到分词处理后的词库与招标项目的对招标名称做减词包含查询,并判断结果,若结果为包含查询有返回,则执行步骤S3,若结果为包含查询无返回,则从末尾减词继续查询。5.根据权利要求4所述的一种基于漏斗模型和余弦算法的中标项目检索方法,其特征在于,所述步骤S201中关键词处理具体包括以下子步骤:S2011. 将中标项目的项目名称和招标项目的项目名称中的英文括号替换为中文括号;S2012. 删去中标项目的名称中的关键词:项目名称、项目编号、不分标段、招标项目。6.根据权利...

【专利技术属性】
技术研发人员:廖泽丽陈锋谢忠任周剑洪张毅赵伟肖佳杭赵航翊
申请(专利权)人:重庆大司空信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1