【技术实现步骤摘要】
本公开涉及招标信息筛选,具体涉及一种招标信息筛选方法、系统、设备及存储介质。
技术介绍
1、招标信息筛选是指利用自动化技术,从互联网上海量的网页中,精准、高效地识别、提取并过滤出有价值的招标公告信息的过程。其核心目标是替代低效的人工查找,为企业和投资者提供及时、全面、纯净的商业机会情报。
2、现有招标信息筛选技术存在明显局限:其一,依赖固定规则或预设模板定位招标信息,难以适配不同网站的异构结构,面对网站改版、布局微调等动态变化时易失效,识别稳定性差;其二,缺乏自适应校准机制,判定标准固定化导致跨平台兼容性不足,信息提取准确率有待进一步提高,且混杂大量无关内容;其三,网站结构变更后需人工重新配置规则,维护成本高昂,恢复周期长达数小时至数天,易造成关键信息遗漏,难以满足商业决策对高纯度情报的需求。
技术实现思路
1、本公开实施例提供一种招标信息筛选方法、系统、设备及存储介质,以解决或缓解现有技术中的以上一个或多个技术问题。
2、根据本公开的一个方面,提供一种招标信息筛选
本文档来自技高网...【技术保护点】
1.一种招标信息筛选方法,其特征在于,包括:
2.根据权利要求1所述的招标信息筛选方法,其特征在于,所述基于预设的网页结构识别规则库,从所述目标网站的网页信息中自动识别网页中招标信息所在的结构化数据区域,包括:
3.根据权利要求2所述的招标信息筛选方法,其特征在于,所述对目标网站的网页信息进行视觉块密度分析,确定信息密集区域,包括:
4.根据权利要求3所述的招标信息筛选方法,其特征在于,所述根据招标信息特征动态设定密度阈值,包括:
5.根据权利要求1所述的招标信息筛选方法,其特征在于,所述对提取的所述招标信息进行多维度去
...【技术特征摘要】
1.一种招标信息筛选方法,其特征在于,包括:
2.根据权利要求1所述的招标信息筛选方法,其特征在于,所述基于预设的网页结构识别规则库,从所述目标网站的网页信息中自动识别网页中招标信息所在的结构化数据区域,包括:
3.根据权利要求2所述的招标信息筛选方法,其特征在于,所述对目标网站的网页信息进行视觉块密度分析,确定信息密集区域,包括:
4.根据权利要求3所述的招标信息筛选方法,其特征在于,所述根据招标信息特征动态设定密度阈值,包括:
5.根据权利要求1所述的招标信息筛选方法,其特征在于,所述对提取的所述招标信息进行多维度去重处理,得到去重后招标信息,包括:
6.根据权利要求5所述的招标信息筛选方法,其特征在于,所述构建招标单位-时间窗口联合索引进行时效性判重,得到去重后招标信息,包括:
7.根据权利要求1所述的招标信息筛选方法,其特征在于,所述对所述去重后招标信息进行自动化分类处理,得到标注类别的招标信息,包括:
8.根据权利要求7所述的招标信息筛选方法,其特征在于,所述基于机器学习模型进行...
【专利技术属性】
技术研发人员:魏杰,沈勇,
申请(专利权)人:中国铁塔股份有限公司安徽省分公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。