System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及语义分析的,尤其涉及一种深度语义分析的电子合同任务分派方法。
技术介绍
1、电子合同在互联网金融、银行、电子商务等业务应用广泛,打破传统地域限制,改变传统快递、传真等合同文件的传递方式,在电子合同在船舶行业应用提供可行性。电子合同的推广在极大提高产业交流效率的同时也为合同的智能分析提供了便利。为了进一步提高电子合同的智能化程度,本专利技术提出一种深度语义分析的电子合同任务分派方法,在电子合同任务内容强关联性和专业性的基础上通过深度语义分析技术实现对电子合同任务内容的自动关联,促进电子合同内容的快速理解与实施,提高任务分派效率。
技术实现思路
1、有鉴于此,本专利技术提供一种深度语义分析的电子合同任务分派方法,目的在于:1)利用两种编码方式分别对电子合同以及任务内容文本数据进行编码表示,在电子合同中分词结果的编码过程中,通过结合分词结果的位置以及前文信息生成分词结果编码结果,使得分词结果的编码结果有效结合了上文信息以及位置信息,增强了电子合同文本编码向量的语义连续性,而对任务内容文本中的内容描述词汇进行基于注意力机制的编码处理,进而得到能够有效表征任务内容有效信息的编码结果;2)分别构建用于对编码结果进行重映射的电子合同句向量重映射矩阵以及任务内容句向量重映射矩阵,通过结合句向量之间的关联性,在不改变句向量本身语义的情况下,对每个句向量添加邻域句向量的语义,使得重映射后每个句向量均可以表征本身以及邻域的语义信息,进而结合特征分解方式分别对流形电子合同向量以及流形任务内容
2、实现上述目的,本专利技术提供的一种深度语义分析的电子合同任务分派方法,包括以下步骤:
3、s1:获取待分派的电子合同文本数据,并生成多种任务内容的文本数据,分别对电子合同文本数据和任务内容文本数据进行编码处理,得到电子合同向量和任务内容向量;
4、s2:对编码处理得到的电子合同向量和任务内容向量分别进行重映射得到流形电子合同向量和流形任务内容向量;
5、s3:构建电子合同任务内容识别模型,所述电子合同任务内容识别模型以流形电子合同向量和流形任务内容向量为输入,以流形电子合同向量对应的任务内容为输出;
6、s4:利用电子合同任务内容识别模型对待分派电子合同文本数据的流形电子合同向量进行任务内容识别,根据任务内容识别结果对待分派的电子合同文本数据进行任务分派。
7、作为本专利技术的进一步改进方法:
8、可选地,所述s1步骤中获取待分派的电子合同文本数据,并生成多种任务内容的文本数据,包括:
9、获取待分派的电子合同文本并进行分词处理,得到待分派的电子合同文本数据:
10、x=(x1,x2,...,xn,...,xn)
11、其中:
12、x表示待分派的电子合同文本数据,xn表示电子合同文本数据x中的第n个分词结果,n表示电子合同文本经分词处理得到的分词结果总数;
13、其中电子合同文本中任意一句合同文本的分词处理流程为:
14、预构建合同文本常用词词典,截取合同文本中前s个文本字符与合同文本常用词词典中的常用词进行比对匹配,若匹配不成功,则截取合同文本前s-1个文本字符与合同文本常用词词典中的常用词进行比对匹配,以此类推,直到比对成功或合同文本仅剩一个文本字符,将比对成功的合同文本字符作为匹配成功的分词结果,并在该句合同文本前删去分词结果,重新进行常用词比对匹配;
15、生成多种任务内容的文本数据:
16、
17、其中:
18、表示第m种电子合同任务内容的文本数据,表示ym中的第m个内容描述词汇,m表示所生成电子合同任务内容的种类数,k表示所生成每种电子合同任务内容的内容描述词汇总数。在本专利技术实施例中,文本数据中的标点符号同样为一个分词结果或者内容描述词汇,并对标点符号利用[cls]符号进行编码表示。
19、可选地,所述s1步骤中分别对电子合同文本数据和任务内容文本数据进行编码处理,包括:
20、分别对电子合同文本数据和任务内容文本数据进行编码处理,得到电子合同向量和任务内容向量,其中文本数据的编码处理流程为:
21、s11:对电子合同文本数据中的任意分词结果及任务内容文本数据中的内容描述词汇进行独热编码表示,得到任意分词结果及内容描述词汇的独热编码表示结果;
22、s12:根据文本数据中的标点符号将分词结果以及内容描述词汇归属到对应句子中,对分词结果进行权重计算:
23、
24、其中:
25、w(xn)表示分词结果xn的权重;
26、exp(·)表示以自然常数为底的指数函数;
27、l(xn)表示分词结果xn所归属句子的句中分词结果总数,loc(xn)表示分词结果xn在所属句子中的位置,即分词结果xn为所属句子的第loc(xn)个分词结果;
28、count(xn)表示分词结果xn在电子合同文本数据x中出现的次数;
29、sum(x)表示电子合同文本数据x中的句子数,sum(x,xn)表示电子合同文本数据x中出现分词结果xn的句子数;
30、并设置内容描述词汇的权重为1;
31、s13:基于分词结果以及内容描述词汇的权重,对分词结果及内容描述词汇的独热编码表示结果进行重编码处理:
32、
33、
34、其中:
35、z(xn)表示分词结果xn的重编码处理结果,表示内容描述词汇的重编码处理结果;
36、w(xn)表示分词结果xn的权重,表示内容描述词汇的权重,其中
37、wx表示预设的分词结果重编码矩阵参数,wy表示预设的内容描述词汇重编码矩阵参数;
38、σ1(·),σ2(·)表示激活函数,其中σ1(·)为relu激活函数,σ2(·)为sigmoid激活函数;
39、其中标点符号未进行重编码处理;
40、s14:基于重编码处理结果,分别构成电子合同向量和任务内容向量:
41、z(x)=(z(x1),z(x2),...,z(xn),...,z(xn))
42、
43、其中:
44、z(x)表示电子合同向量;
45、z(ym)第m种电子合同任务内容的任务内容向量。
46、可选地,所述s2步骤中对编码处理得到的电子合同向量和任务内容向量分别进行重映射,包括:
47、对编码处理得到的电子合同向量和任务内容向量分别进行重映射,其中重映射流程为:
48、s21:将电子合同向量和任务内容向量分别切分为句向量,得到电子合同句向量集合以及任务本文档来自技高网...
【技术保护点】
1.一种深度语义分析的电子合同任务分派方法,其特征在于,所述方法包括:
2.如权利要求1所述的一种深度语义分析的电子合同任务分派方法,其特征在于,所述S1步骤中获取待分派的电子合同文本数据,并生成多种任务内容的文本数据,包括:
3.如权利要求2所述的一种深度语义分析的电子合同任务分派方法,其特征在于,所述S1步骤中分别对电子合同文本数据和任务内容文本数据进行编码处理,包括:
4.如权利要求3所述的一种深度语义分析的电子合同任务分派方法,其特征在于,所述S2步骤中对编码处理得到的电子合同向量和任务内容向量分别进行重映射,包括:
5.如权利要求1所述的一种深度语义分析的电子合同任务分派方法,其特征在于,所述S3步骤中构建电子合同任务内容识别模型,包括:
6.如权利要求5所述的一种深度语义分析的电子合同任务分派方法,其特征在于,所述S3步骤中电子合同任务内容识别模型的训练流程包括:
7.如权利要求6所述的一种深度语义分析的电子合同任务分派方法,其特征在于,所述S4步骤中利用电子合同任务内容识别模型对待分派电子合同文
...【技术特征摘要】
1.一种深度语义分析的电子合同任务分派方法,其特征在于,所述方法包括:
2.如权利要求1所述的一种深度语义分析的电子合同任务分派方法,其特征在于,所述s1步骤中获取待分派的电子合同文本数据,并生成多种任务内容的文本数据,包括:
3.如权利要求2所述的一种深度语义分析的电子合同任务分派方法,其特征在于,所述s1步骤中分别对电子合同文本数据和任务内容文本数据进行编码处理,包括:
4.如权利要求3所述的一种深度语义分析的电子合同任务分派方法,其特征在于,所述s2步骤中对编码处理得到的电子...
【专利技术属性】
技术研发人员:李强,陈臻,
申请(专利权)人:上海朗晖慧科技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。