合同条款相似度计算方法、装置、设备及可读存储介质制造方法及图纸

技术编号:21771916 阅读:23 留言:0更新日期:2019-08-03 21:37
本发明专利技术公开了一种合同条款相似度计算方法,包括:基于词向量模型对待计算合同条款进行训练;基于匹配句子向量以及词向量确定所述待计算合同条款对应的句子向量;计算待计算合同条款与各个预设合同条款之间的相似度;确定待计算合同条款对应的目标预设合同条款;将目标预设合同条款以及目标预设合同条款对应的相似度发送至所述待计算合同条款对应的终端。本发明专利技术还公开了一种合同条款相似度计算装置、设备及可读存储介质。本发明专利技术通过数据处理技术对合同条款进行处理,能够准确确定合同条款数据库中与待计算合同条款最相似的条款,以便于用户根据该目标预设合同条款修改待计算合同条款,从而减少待计算合同条款所导致的潜在威胁和损失。

Computing Method, Device, Equipment and Readable Storage Medium of Contract Terms Similarity

【技术实现步骤摘要】
合同条款相似度计算方法、装置、设备及可读存储介质
本专利技术涉及数据处理
,尤其涉及一种合同条款相似度计算方法、装置、设备及可读存储介质。
技术介绍
随着经济社会的飞速发展,每个人在工作和生活中都不可避免的会接触合同文本,例如聘用入职、房屋出租、房屋求租、二手房买卖、外出旅游等等。合同的交易对方既包括个人,也包括企业法人等。合同文本的形式既包括即时手写合同,也包括交易对方预先准备好的合同范本。尤其是在面对房屋买卖中介机构、旅游服务公司、房屋租赁中介机构等各种机构时,由于这些机构有意或无意的会在合同范本中隐藏一些对用户不甚公平的合同条款。面对这些不甚合理的合同文本,大多数用户难以全部发现这些文本中的不合理条款,从而为用户带来许多潜在的威胁和损失。目前,现有的合同分析方案或文献中,大多关注于合同条款生成,利用合同模板技术帮助用户生成空白合同。并没有针对合同条款进行识别分析,难以识别出合同条款中的不合理风险信息,导致合同条款存在潜在的风险上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种合同条款相似度计算方法、装置、设备及可读存储介质,旨在解决难以识别出合同条款中的不合理风险信息的技术问题。为实现上述目的,本专利技术提供一种合同条款相似度计算方法,所述合同条款相似度计算方法包括以下步骤:基于词向量模型对待计算合同条款进行训练,以获得所述待计算合同条款对应的词向量;基于匹配句子向量以及所述词向量确定所述待计算合同条款对应的句子向量;基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待计算合同条款与各个所述预设合同条款之间的相似度;基于所述相似度,在所述合同条款数据库中,确定所述待计算合同条款对应的目标预设合同条款;将所述目标预设合同条款以及所述目标预设合同条款对应的相似度发送至所述待计算合同条款对应的终端。进一步地,所述基于匹配句子向量以及所述词向量确定所述待计算合同条款对应的句子向量的步骤包括:计算匹配句子向量中的词向量与所述词向量之间的相似度,基于所述相似度生成相似词矩阵,其中,所述相似词矩阵中的每一行的元素为同一词向量与匹配句子向量中的词向量之间的相似度;基于所述相似词矩阵的每一列元素中的最大相似度,生成所述句子向量。进一步地,所述基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待计算合同条款与各个所述预设合同条款之间的相似度的步骤包括:基于所述待计算合同条款,通过Tf-idf算法,确定各个预设合同条款的预设句子向量中的目标句子向量;基于所述句子向量以及目标句子向量,计算所述待计算合同条款,与所述预设合同条款中目标句子向量对应的目标合同条款之间的相似度。进一步地,所述基于所述待计算合同条款,通过Tf-idf算法,确定各个预设合同条款的预设句子向量中的目标句子向量的步骤包括:遍历预设合同条款,得到当前遍历的预设合同条款;遍历待计算合同条款的条款信息中各个词语,计算当前遍历的词语与当前遍历的预设合同条款之间的Tf值以及idf值,并计算所述Tf值与所述idf值的乘积;在待计算合同条款的条款信息中各个词语遍历完成时,计算各个词语对应的所述Tf值与所述idf值的乘积的均值,以获得所述待计算合同条款与当前遍历的预设合同条款之间的Tf-idf值;在所述预设合同条款遍历完成时,将各个Tf-idf值中预设数量的最大的Tf-idf值,所对应的预设句子向量中作为所述目标句子向量。进一步地,所述基于词向量模型对所述待计算合同条款进行训练,以获得所述待计算合同条款对应的词向量的步骤包括:基于预设停用词,对所述待计算合同条款进行停用词过滤操作,以获得条款信息;基于词向量模型对所述条款信息进行训练,以获得所述词向量。进一步地,所述将所述目标预设合同条款以及所述目标预设合同条款对应的相似度发送至所述待计算合同条款对应的终端的步骤包括:若所述合同条款数据库中存在目标预设合同条款对应的修改建议信息,则获取所述目标预设合同条款对应的修改建议信息;采用最长公共子序列算法或者最长公共子串算法,基于所述目标预设合同条款,对所述待计算合同条款进行标注操作;将所述目标预设合同条款、所述目标预设合同条款对应的相似度、所述修改建议信息以及标注后的所述待计算合同条款发送至所述待计算合同条款对应的终端。进一步地,所述合同条款相似度计算方法还包括:获取预设合同条款,并基于词向量模型对所述预设合同条款进行训练,以获得所述预设合同条款对应的词向量;基于匹配句子向量以及所述预设合同条款对应的词向量,确定所述预设合同条款对应的预设句子向量;基于所述预设合同条款及所述预设句子向量生成所述合同条款数据库。此外,为实现上述目的,本专利技术还提供一种合同条款相似度计算装置,所述合同条款相似度计算装置包括:训练模块,用于基于词向量模型对待计算合同条款进行训练,以获得所述待计算合同条款对应的词向量;第一确定模块,用于基于匹配句子向量以及所述词向量确定所述待计算合同条款对应的句子向量;计算模块,用于基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待计算合同条款与各个所述预设合同条款之间的相似度;第二确定模块,用于基于所述相似度,在所述合同条款数据库中,确定所述待计算合同条款对应的目标预设合同条款;发送模块,用于将所述目标预设合同条款以及所述目标预设合同条款对应的相似度发送至所述待计算合同条款对应的终端。此外,为实现上述目的,本专利技术还提供一种合同条款相似度计算设备,所述合同条款相似度计算设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的合同条款相似度计算程序,所述合同条款相似度计算程序被所述处理器执行时实现前述的合同条款相似度计算方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有合同条款相似度计算程序,所述合同条款相似度计算程序被处理器执行时实现前述的合同条款相似度计算方法的步骤。本专利技术通过基于词向量模型对待计算合同条款进行训练,以获得所述待计算合同条款对应的词向量,接着基于匹配句子向量以及所述词向量确定所述待计算合同条款对应的句子向量,而后基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待计算合同条款与各个所述预设合同条款之间的相似度,然后基于所述相似度,在所述合同条款数据库中,确定所述待计算合同条款对应的目标预设合同条款,最后将所述目标预设合同条款以及所述目标预设合同条款对应的相似度至所述待计算合同条款对应的终端,通过数据处理技术对合同条款进行处理,能够准确确定合同条款数据库中与待计算合同条款最相似的条款,以便于用户根据该目标预设合同条款修改待计算合同条款,从而减少待计算合同条款所导致的潜在威胁和损失。附图说明图1是本专利技术实施例方案涉及的硬件运行环境中合同条款相似度计算设备的结构示意图;图2为本专利技术合同条款相似度计算方法第一实施例的流程示意图;图3为本专利技术合同条款相似度计算方法第二实施例中基于匹配句子向量以及所述词向量确定所述待计算合同条款对应的句子向量的步骤的细化流程示意图;图4为本专利技术合同条款相似度计算方法第三实施例中基于所述句子向本文档来自技高网...

【技术保护点】
1.一种合同条款相似度计算方法,其特征在于,所述合同条款相似度计算方法包括以下步骤:基于词向量模型对待计算合同条款进行训练,以获得所述待计算合同条款对应的词向量;基于匹配句子向量以及所述词向量确定所述待计算合同条款对应的句子向量;基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待计算合同条款与各个所述预设合同条款之间的相似度;基于所述相似度,在所述合同条款数据库中,确定所述待计算合同条款对应的目标预设合同条款;将所述目标预设合同条款以及所述目标预设合同条款对应的相似度发送至所述待计算合同条款对应的终端。

【技术特征摘要】
1.一种合同条款相似度计算方法,其特征在于,所述合同条款相似度计算方法包括以下步骤:基于词向量模型对待计算合同条款进行训练,以获得所述待计算合同条款对应的词向量;基于匹配句子向量以及所述词向量确定所述待计算合同条款对应的句子向量;基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待计算合同条款与各个所述预设合同条款之间的相似度;基于所述相似度,在所述合同条款数据库中,确定所述待计算合同条款对应的目标预设合同条款;将所述目标预设合同条款以及所述目标预设合同条款对应的相似度发送至所述待计算合同条款对应的终端。2.如权利要求1所述的合同条款相似度计算方法,其特征在于,所述基于匹配句子向量以及所述词向量确定所述待计算合同条款对应的句子向量的步骤包括:计算匹配句子向量中的词向量与所述词向量之间的相似度,基于所述相似度生成相似词矩阵,其中,所述相似词矩阵中的每一行的元素为同一词向量与匹配句子向量中的词向量之间的相似度;基于所述相似词矩阵的每一列元素中的最大相似度,生成所述句子向量。3.如权利要求1所述的合同条款相似度计算方法,其特征在于,所述基于所述句子向量以及合同条款数据库中各个预设合同条款的预设句子向量,计算所述待计算合同条款与各个所述预设合同条款之间的相似度的步骤包括:基于所述待计算合同条款,通过Tf-idf算法,确定各个预设合同条款的预设句子向量中的目标句子向量;基于所述句子向量以及目标句子向量,计算所述待计算合同条款,与所述预设合同条款中目标句子向量对应的目标合同条款之间的相似度。4.如权利要求3所述的合同条款相似度计算方法,其特征在于,所述基于所述待计算合同条款,通过Tf-idf算法,确定各个预设合同条款的预设句子向量中的目标句子向量的步骤包括:遍历预设合同条款,得到当前遍历的预设合同条款;遍历待计算合同条款的条款信息中各个词语,计算当前遍历的词语与当前遍历的预设合同条款之间的Tf值以及idf值,并计算所述Tf值与所述idf值的乘积;在待计算合同条款的条款信息中各个词语遍历完成时,计算各个词语对应的所述Tf值与所述idf值的乘积的均值,以获得所述待计算合同条款与当前遍历的预设合同条款之间的Tf-idf值;在所述预设合同条款遍历完成时,将各个Tf-idf值中预设数量的最大的Tf-idf值,所对应的预设句子向量中作为所述目标句子向量。5.如权利要求1所述的合同条款相似度计算方法,其特征在于,所述基于词向量模型对所述待计算合同条款进行训练,以获得所述待...

【专利技术属性】
技术研发人员:田磊马皓王威胡家义吴力丰王昊邹永卫
申请(专利权)人:平安城市建设科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1