【技术实现步骤摘要】
本专利技术属于文本相似度检测,特别涉及一种投标文本相似度检测系统及检测方法。
技术介绍
1、招投标过程中的围串标行为屡禁不止,在开标之前进行违规行为的检测也成了许多招投标项目的必经流程。一般来说,如果两份或多份投标书文本相似度过高,则会被认为有串围标的嫌疑,应进行进一步鉴别。但是投标文件通常有上百页,如果完全通过人工来审核,效率过低,需要利用信息化工具来协助进行文本相似度的比对。
2、现有处理投标文本的技术大多通过基于欧氏距离或余弦距离的距离度量方法来对整份投标文本进行相似度判定,识别出相似文本的准确度较低,且由于投标文件文本中固定模板的存在,容易导致结果的误判,造成不必要的人工复核成本。
3、双向长短时记忆网络双向长短时记忆网络bilstm(英文全称为:bi-directionallong short-term memory)是一种携带信息跨越多个时间步的方法,能过从正向和逆向提取时间步信息,从而既能考虑上文信息,又能考虑下文信息,其在时间序列及自然语言处理等任务上表现良好。
4、双向编码表征模型b
...【技术保护点】
1.一种投标文本相似度检测系统,其特征在于:包括投标文件生成客户端,投标文件生成客户端与在线检测子系统电性连接;所述的投标文件生成客户端包括信息搜集模块和加密上传模块;所述的在线检测子系统包括数据存储模块、解密模块、文本分析模块和信息推送模块;加密上传模块与数据存储模块电性连接;
2.根据权利要求1所述的一种投标文本相似度检测系统的检测方法,其特征在于包括以下方法:
3.根据权利要求2所述的一种投标文本相似度检测系统的检测方法,其特征在于包括以下方法:步骤S2的子步骤如下:
4.根据权利要求2所述的一种投标文本相似度检测系统的检测方
...【技术特征摘要】
1.一种投标文本相似度检测系统,其特征在于:包括投标文件生成客户端,投标文件生成客户端与在线检测子系统电性连接;所述的投标文件生成客户端包括信息搜集模块和加密上传模块;所述的在线检测子系统包括数据存储模块、解密模块、文本分析模块和信息推送模块;加密上传模块与数据存储模块电性连接;
2.根据权利要求1所述的一种投标文本相似度检测系统的检测方法,其特征在于包括以下方法:
3.根据权利要求2所述的一种投标文本相似度检测系统的检测方法,其特征在于包括以下方法:步骤s2的子步骤如下:
4.根据权利要求2所述的一种投标文本相似度检测系统的检测方法,其特征在于包括以下方法:步骤s3的子步骤如下:
5.根据权利要求4所述的一种投标文本相似度检测系统的检测方法,其特征在于包括以下方法:步骤s3.1的子步骤如下:
6.根据权利要求4所述的一种投标文本相似度检测系统的检测方法,其特征在于包括以下方法:主成分分析算法的实现步骤如...
【专利技术属性】
技术研发人员:陈楷烨,王珊珊,楚金,崔凯,杨楷文,
申请(专利权)人:三峡物资招标管理有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。