【技术实现步骤摘要】
案由分类方法、装置、计算机设备和存储介质
本申请涉及分类模型的
,特别涉及一种案由分类方法、装置、计算机设备和存储介质。
技术介绍
目前,人们对知识产权越来越重视,随之而来的是越来越多的知识产权案件发生。然而民法中知识产权案件的案由类型多达几十种,用户在面临知识产权案件发生时,非民法专业的人士很难对这些案件的案由类型进行区分,业内也没有专门针对知识产权案件进行案由分类的产品。
技术实现思路
本申请的主要目的为提供一种案由分类方法、装置、计算机设备和存储介质,实现对知识产权案件的案由进行分类。为实现上述目的,本申请提供了一种案由分类方法,包括以下步骤:获取案情文本,并构建所述案情文本对应的词嵌入;其中,所述案情文本为知识产权案件的案情文本;将构建得到的词嵌入输入至预设的分类模型中;所述分类模型为融合CNN模型以及DBM模型训练得到,其中,所述CNN模型的全连接层与所述DBM模型的特征输出层共同连接的一个输出层作为所述分类模型的最终输出层;分别通过所述CNN模型以及DBM模型提取所述词嵌入的特征向量;其中,通过所述CNN模型的全连接层提取出所述词嵌入对应在各个输出类 ...
【技术保护点】
1.一种案由分类方法,其特征在于,包括以下步骤:获取案情文本,并构建所述案情文本对应的词嵌入;其中,所述案情文本为知识产权案件的案情文本;将构建得到的词嵌入输入至预设的分类模型中;所述分类模型为融合CNN模型以及DBM模型训练得到,其中,所述CNN模型的全连接层与所述DBM模型的特征输出层共同连接的一个输出层作为所述分类模型的最终输出层;分别通过所述CNN模型以及DBM模型提取所述词嵌入的特征向量;其中,通过所述CNN模型的全连接层提取出所述词嵌入对应在各个输出类别的局部特征向量,以及通过所述DBM模型的特征输出层提取出所述词嵌入对应在各个输出类别的全局特征向量;通过所述最 ...
【技术特征摘要】
1.一种案由分类方法,其特征在于,包括以下步骤:获取案情文本,并构建所述案情文本对应的词嵌入;其中,所述案情文本为知识产权案件的案情文本;将构建得到的词嵌入输入至预设的分类模型中;所述分类模型为融合CNN模型以及DBM模型训练得到,其中,所述CNN模型的全连接层与所述DBM模型的特征输出层共同连接的一个输出层作为所述分类模型的最终输出层;分别通过所述CNN模型以及DBM模型提取所述词嵌入的特征向量;其中,通过所述CNN模型的全连接层提取出所述词嵌入对应在各个输出类别的局部特征向量,以及通过所述DBM模型的特征输出层提取出所述词嵌入对应在各个输出类别的全局特征向量;通过所述最终输出层对各个输出类别的所述局部特征向量以及全局特征向量进行融合,输出各个所述输出类别的目标特征向量;并对各个所述输出类别的所述目标特征向量进行sigmod计算得到对应的输出结果;依次判断对应各个所述输出类别的所述输出结果是否大于阈值,若大于,则判定所述知识产权案件的案由为对应的输出类别。2.根据权利要求1所述的案由分类方法,其特征在于,所述通过所述最终输出层对各个输出类别的所述局部特征向量以及全局特征向量进行融合的融合计算过程为:V=f(yc+yd),其中,V为目标特征向量,yc为局部特征向量,yd为全局特征向量;所述对各个所述输出类别的所述目标特征向量进行sigmod计算得到对应的输出结果的计算过程为:其中,所述f(V)的结果为0-1之间。3.根据权利要求1所述的案由分类方法,其特征在于,所述获取案情文本,并构建所述案情文本对应的词嵌入的步骤之前,包括:对训练集中的案情文本分别构建词嵌入,得到训练词嵌入;其中,所述训练集中的案情文本为知识产权案件的案情文本,且具有正确案由结果;将所述训练词嵌入分别输入至原始CNN模型以及原始DBM模型中进行迭代训练,以使得所述原始CNN模型以及原始DBM模型的输出结果为所述训练集中案情文本对应的正确案由结果时,分别得到所述原始CNN模型以及原始DBM模型对应的训练参数;根据所述原始CNN模型以及原始DBM模型对应的训练参数,得到训练完成的CNN模型以及DBM模型;分别将所述训练词嵌入输入至所述训练完成的CNN模型以及DBM模型中,并通过所述训练完成的CNN模型的全连接层提取出所述训练词嵌入对应在各个输出类别的训练局部特征向量,以及通过所述DBM模型的特征输出层提取出所述训练词嵌入对应在各个输出类别的训练全局特征向量;将对应所述各个输出类别的训练局部特征向量以及训练全局特征向量输入至最终输出层进行训练,当使得所述最终输出层的输出结果对应为所述正确案由结果时,得到所述最终输出层的训练参数;根据所述原始CNN模型、原始DBM模型对应的训练参数以及所述最终输出层的训练参数,得到训练完成的所述分类模型。4.根据权利要求1所述的案由分类方法,其特征在于,所述获取案情文本,并构建所述案情文本对应的词嵌入的步骤,包括:获取所述案情文本,并对所述案情文本中的每一个语句进行分词,对分词后的词语进行语义识别以识别所述词语是否与案件的案情内容相关;选择出包括有与案件的案情内容相关的词语的每一个语句,作为目标语句...
【专利技术属性】
技术研发人员:汪成,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。