【技术实现步骤摘要】
合同文档合规性检查方法及装置
本专利技术涉及文本数据处理
,尤其涉及一种合同文档合规性检查方法及装置。
技术介绍
互联网保险行业是一个瞬息万变,而又面临强监管的行业。一方面,互联网保险公司需要不断推陈出新,开发符合市场需求的保险产品;另一方面,保险行业又受到严格的监管,任何产品的上市都需要符合监管的要求。保险公司法律合规审查需要应对大量的合同文档,保证所有的合同文档符合监管法律法规的要求。而现有的合同文档检查方法中,对每个句子检查时一般只考虑当前的句子本身,导致最后得到的检查结果并不准确。
技术实现思路
本专利技术实施例提出一种合同文档合规性检查方法,用以对合同文档的合规性进行检查,准确度高,该方法包括:对合同文档中每个句子进行分词,获得每个句子中每个词的词向量;将每个句子所包含的词的词向量进行合并,构成每个句子的第一句向量,所述第一句向量为与上下文无关的句向量;将每个句子的第一句向量输入至上下文信息融合模型,接收上下文信息融合模型输出的每个句子的第二句向量,所述第二句向量为 ...
【技术保护点】
1.一种合同文档合规性检查方法,其特征在于,包括:/n对合同文档中每个句子进行分词,获得每个句子中每个词的词向量;/n将每个句子所包含的词的词向量进行合并,构成每个句子的第一句向量,所述第一句向量为与上下文无关的句向量;/n将每个句子的第一句向量输入至上下文信息融合模型,接收上下文信息融合模型输出的每个句子的第二句向量,所述第二句向量为包含上下文信息的句向量,所述上下文信息融合模型用于基于每个句子的第一句向量,获得每个句子的第二句向量;/n基于每个句子的第二句向量,判断每个句子的合规性。/n
【技术特征摘要】
1.一种合同文档合规性检查方法,其特征在于,包括:
对合同文档中每个句子进行分词,获得每个句子中每个词的词向量;
将每个句子所包含的词的词向量进行合并,构成每个句子的第一句向量,所述第一句向量为与上下文无关的句向量;
将每个句子的第一句向量输入至上下文信息融合模型,接收上下文信息融合模型输出的每个句子的第二句向量,所述第二句向量为包含上下文信息的句向量,所述上下文信息融合模型用于基于每个句子的第一句向量,获得每个句子的第二句向量;
基于每个句子的第二句向量,判断每个句子的合规性。
2.如权利要求1所述的合同文档合规性检查方法,其特征在于,还包括:
对合同文档进行预处理,提取合同文档中的每一个句子。
3.如权利要求1所述的合同文档合规性检查方法,其特征在于,将每个句子的第一句向量输入至上下文信息融合模型,接收上下文信息融合模型输出的每个句子的第二句向量,包括:
将每个句子的第一句向量及对应的上下文的句子的第一句向量输入至上下文信息融合模型,接收上下文信息融合模型输出的每个句子的第二句向量,所述上下文的句子为预设窗口内相邻的句子。
4.如权利要求1所述的合同文档合规性检查方法,其特征在于,所述上下文信息融合模型包括基于循环神经网络的信息融合模型和基于注意力机制的模型。
5.如权利要求1所述的合同文档合规性检查方法,其特征在于,基于每个句子的第二句向量,判断每个句子的合规性,包括:
对每个句子,基于预先设置的合规性分类规则对该句子的第二句向量...
【专利技术属性】
技术研发人员:闫永泽,刘设伟,陈利琴,
申请(专利权)人:泰康保险集团股份有限公司,泰康在线财产保险股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。