一种基于人工智能的标书查重方法及系统技术方案

技术编号:46079401 阅读:10 留言:0更新日期:2025-08-12 18:03
本发明专利技术公开了一种基于人工智能的标书查重方法及系统,通过多模态解析(文本、图像、表格)、动态权重模型和可视化报告,实现对标书内容的全面分析与精准查重。本发明专利技术突破传统文本比对局限,支持图像、表格等非文本元素的相似度检测;采用词袋向量和赋值降维技术捕捉深层语义相似性;通过自适应分块算法提升图像匹配准确性;基于属性项权重实现表格数据的语义匹配;动态权重分配增强策略针对性;可视化报告直观呈现重复内容;抗干扰预处理提升分析精度;兼容多格式文档适应多样化需求。本发明专利技术显著提升了标书查重的全面性、准确性和效率,有效解决复杂格式和语义理解难题,满足招投标领域对公平性和原创性的高要求。

【技术实现步骤摘要】

本专利技术涉及标书处理,更具体的说是涉及一种基于人工智能的标书查重方法及系统


技术介绍

1、目前,在招投标领域,标书作为参与投标的核心文件,其内容的原创性与独特性直接关系到招投标活动的公平公正以及项目的顺利推进。随着招投标市场规模的持续扩大,每年产生的标书数量海量增长。例如,在大型建筑工程、政府采购等领域,一场招标活动可能会收到成百上千份标书。在这种情况下,高效且精准的标书查重工作成为保障招投标活动质量的关键环节。

2、随着信息技术的进步,基于文本比对算法的查重工具应运而生。这些工具在一定程度上提高了查重效率,它们能够快速对文本进行字符匹配,查找重复片段。然而,标书的内容结构复杂,除了常规的文字描述,还包含图表、公式、特殊符号等多种元素,且文档格式多样,如pdf、word、excel等。现有的基于文本比对算法的查重工具,大多仅能对纯文本内容进行较为简单的比对,对于包含复杂格式和多元内容的标书,难以准确识别其中的重复部分,导致查重准确性大打折扣。例如,当标书内容经过格式调整、同义词替换或语句顺序变换后,这些工具可能无法有效判断其相似性。

本文档来自技高网...

【技术保护点】

1.一种基于人工智能的标书查重方法,其特征在于,包括:

2.根据权利要求1所述的一种基于人工智能的标书查重方法,其特征在于,所述预处理包括去除标书文档的干扰信息。

3.根据权利要求1所述的一种基于人工智能的标书查重方法,其特征在于,所述基于文本数据进行语义比对具体包括:

4.根据权利要求3所述的一种基于人工智能的标书查重方法,其特征在于,所述赋值降维处理包括如下步骤:

5.根据权利要求1所述的一种基于人工智能的标书查重方法,其特征在于,所述基于图像特征进行图像比对具体包括:

6.根据权利要求5所述的一种基于人工智能的标书查重方法...

【技术特征摘要】

1.一种基于人工智能的标书查重方法,其特征在于,包括:

2.根据权利要求1所述的一种基于人工智能的标书查重方法,其特征在于,所述预处理包括去除标书文档的干扰信息。

3.根据权利要求1所述的一种基于人工智能的标书查重方法,其特征在于,所述基于文本数据进行语义比对具体包括:

4.根据权利要求3所述的一种基于人工智能的标书查重方法,其特征在于,所述赋值降维处理包括如下步骤:

5.根据权利要求1所述的一种基于人工智能的标书查重方法,其特征在于,所述基于图像特征进行图像比对具体包括:

6.根据权利要求5所...

【专利技术属性】
技术研发人员:薛伟鹏
申请(专利权)人:法正智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1