法律相关文本的归类方法、归类装置及相应的电子设备制造方法及图纸

技术编号:20566667 阅读:28 留言:0更新日期:2019-03-14 09:28
本发明专利技术实施例公开了一种法律相关文本的归类方法、归类装置及相应的电子设备,应用于语义识别技术领域。该方法包括:通过预先构建的语义识别模型,识别确定多个法律相关文本中任一法律相关文本的至少一个要素信息,然后根据至少一个要素信息对任一法律相关文本进行归类处理,进而建立多个法律相关文本中任一法律相关文本与其相应的至少一个类别的索引关系,并进行存储。本发明专利技术实施例实现了法律相关文本要素信息的智能识别,在保证了提取准确率的同时提升了要素信息提取的效率,此外,根据识别确定的要素信息对法律相关文本进行自动化归类,从而为后续对法律相关文本进行高效准确的检索提供了可靠保证。

Categorization Method, Categorization Device and Corresponding Electronic Equipment of Legal Relevant Texts

The embodiment of the present invention discloses a classification method, a classification device and corresponding electronic devices for legal related texts, which are applied in the field of semantic recognition technology. The method includes: identifying and determining at least one element information of any legal-related text in multiple legal-related texts through a pre-constructed semantic recognition model, then classifying and processing any legal-related text according to at least one element information, and then establishing an index relationship between any legal-related text in multiple legal-related texts and its corresponding at least one category. And store it. The embodiment of the present invention realizes the intelligent recognition of legal related text element information, improves the efficiency of extracting element information while guaranteeing the accuracy of extracting. In addition, the legal related text is automatically classified according to the identified element information, thus providing a reliable guarantee for efficient and accurate retrieval of legal related text in the follow-up.

【技术实现步骤摘要】
法律相关文本的归类方法、归类装置及相应的电子设备
本专利技术实施例涉及语义识别
,特别是涉及一种法律相关文本的归类方法、归类装置及相应的电子设备。
技术介绍
裁判文书作为诉讼活动结果的载体,是人民法院确定和分配当事人实体权利义务的惟一凭证,也是律师、公司法务人员、学者、其他法律工作者了解、研究具体司法实践的重要文献资料。根据中国裁判文书网数据显示,迄今为止该网站已收录公开裁判文书5013万余篇,且正以每天近万篇的数量增加,如此庞大数量的裁判文书,需要合理的归类方法,使得裁判文书的检索查找更具效率。目前,在对裁判文书进行归档时,需要人工阅读每篇裁判文书,然后提取并记录裁判文书的基本信息关键字(如案号、原告、被告等),然而,根据现行的人工提取并记录裁判文书基本信息关键字的方式,需要工作人员一篇篇阅读裁判文书的相关内容,才能确定需要记录的基本信息关键字,效率低下且容易出错。专利技术人在具体实施过程中,发现现有技术中在裁判文书归档时,存在人工提取并记录裁判文书基本信息关键字效率低且易出错的问题,以及存在没有合理的法律相关文本归类方法的问题。
技术实现思路
有鉴于此,本专利技术实施例提供了一种法律相关文本的归类方法、归类装置及相应的电子设备,能够解决人工提取并记录法律相关文本基本信息关键字效率低且易出错的问题,以及没有合理的法律相关文本归类方法的问题。为了解决上述问题,本专利技术实施例主要提供如下技术方案:第一方面,提供了一种法律相关文本的归类方法,该方法包括:通过预先构建的语义识别模型,识别确定多个法律相关文本中任一法律相关文本的至少一个要素信息;根据至少一个要素信息对任一法律相关文本进行归类处理;建立多个法律相关文本中任一法律相关文本与其相应的至少一个类别的索引关系,并进行存储。第二方面,提供了一种法律相关文本的归类装置,该归类装置包括:识别确定模块,用于通过预先构建的语义识别模型,识别确定多个法律相关文本中任一法律相关文本的至少一个要素信息;归类模块,用于根据识别确定模块识别确定的至少一个要素信息对任一法律相关文本进行归类处理;建立模块,用于建立多个法律相关文本中任一法律相关文本与其相应的归类模块归类处理的至少一个类别的索引关系;存储模块,用于存储建立模块建立的索引关系。第三方面,提供了一种电子设备,该电子设备包括:处理器、存储器、通信接口和总线;其中,处理器、存储器、通信接口通过总线完成相互间的通信;通信接口用于该电子设备与终端设备的通信设备之间的信息传输;处理器用于调用存储器中的程序指令,以执行第一方面所示的法律相关文本的归类方法。第四方面,一种非暂态计算机可读存储介质,其特征在于,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行第一方面所示的法律相关文本的归类方法。借由上述技术方案,本专利技术实施例提供的技术方案至少具有下列优点:本专利技术实施例提供了一种法律相关文本的归类方法、归类装置及相应的电子设备,与现有技术仅通过人工方式提取法律相关文本的基本信息关键字相比,本专利技术实施例中通过预先构建的语义识别模型,识别确定多个法律相关文本中任一法律相关文本的至少一个要素信息,实现了法律相关文本要素信息的智能识别,在保证了提取准确率的同时提升了要素信息提取的效率,为后续法律相关文本的归类提供了前提保证;然后根据至少一个要素信息对任一法律相关文本进行归类处理,进而建立多个法律相关文本中任一法律相关文本与其相应的至少一个类别的索引关系,并进行存储,即根据识别确定的要素信息对法律相关文本进行自动化归类,从而为后续对法律相关文本进行高效准确的检索提供了可靠保证。上述说明仅是本专利技术实施例技术方案的概述,为了能够更清楚了解本专利技术实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术实施例的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例提供的一种法律相关文本的归类方法的流程示意图;图2示出了本专利技术实施例提供的一种法律相关文本的归类装置的结构示意图;图3示出了本专利技术实施例提供的另一种法律相关文本的归类装置的结构示意图;图4示出了本专利技术实施例提供的一种电子设备的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本专利技术实施例提供了一种法律相关文本的归类方法,如图1所示,该方法包括:步骤S101:通过预先构建的语义识别模型,识别确定多个法律相关文本中任一法律相关文本的至少一个要素信息。对于本专利技术实施例,法律相关文本中包含了大量的信息,以裁判文书为例进行说明,裁判文书作为诉讼活动结果的载体,承载着大量的信息,如法院信息、当事人信息、案由信息、争议焦点信息、案件事实信息、证据信息、裁判理由信息、裁判结果信息等,可根据需求预先设置识别提取裁判文书的裁判理由信息、案件争议焦点信息等。此外,由于法律相关文本中的多种信息并无固定的表达方式,如案件争议焦点信息,在争议焦点的起始部分,法官可能会有“本院经审查认为”、“本院经审理认为”等不同的表达,对于具体的争议焦点信息部分,鉴于其当事人诉求不同,法官归纳的争议焦点可能差异更大,如裁判理由部分,法官可能会引用不同的法律条款,即便是引用同一法律的同一条款,不同法官对该条款的阐述说理不尽相同,可以通过预先构建的语义识别模型,识别确定裁判文书中的至少一个要素信息。其中,预先构建的语义识别模型可以为神经网络模型,通过多层次、非线性的算法,确定出法律相关文本的要素信息,示例性的,预先构建的语义识别模型可以为采用卷积神经网络(ConvolutionNeuralNetwork)CNN模型,根据CNN网络模型,法律相关文本的词作为向量元素构成一个词向量,该词向量可以作为CNN网络的输入,获取到这样的词向量之后,CNN算法对词向量进行过滤、卷积以及池化处理,再输入到神经网络的隐藏层进行进一步分析,继而得到识别结果,可以理解,预先构建的语义识别模型还可以为采用其他算法的模型,或者算法模型的结合,在此不做限定。例如,对某一民事判决裁判文书,该裁判文书中部分内容为“本院经审理认为,本案的争议焦点在于:(一)本案专利申请权是否属于xx公司所有;(二)xx公司是否基于优先权制度仍然享有本案专利申请权……”将裁判文书的文本内容输入预先构建的语义识别模型,也可以对裁判文书进行分词处理后再输入预先构建的语义识别模型,通过预先构建的语义识别模型,可以确定裁判文书中的关键词(如专利申请权、优先权制度等)作为该裁判文书的要素信息。其中,以裁判文书为例对本专利技术进行具体实施例的解释,仅仅是出于示例的目的,本专利技术的实施例不限于此。步骤S102:根据至少一个要素信息对任一法律相关文本进行归类处理。对于本专利技术实施例,通过步骤本文档来自技高网...

【技术保护点】
1.一种法律相关文本的归类方法,其特征在于,包括:通过预先构建的语义识别模型,识别确定多个法律相关文本中任一法律相关文本的至少一个要素信息;根据所述至少一个要素信息对所述任一法律相关文本进行归类处理;建立所述多个法律相关文本中任一法律相关文本与其相应的至少一个类别的索引关系,并进行存储。

【技术特征摘要】
1.一种法律相关文本的归类方法,其特征在于,包括:通过预先构建的语义识别模型,识别确定多个法律相关文本中任一法律相关文本的至少一个要素信息;根据所述至少一个要素信息对所述任一法律相关文本进行归类处理;建立所述多个法律相关文本中任一法律相关文本与其相应的至少一个类别的索引关系,并进行存储。2.根据权利要求1所述的法律相关文本的归类方法,其特征在于,所述通过预先构建的语义识别模型,识别确定多个法律相关文本中任一法律相关文本的至少一个要素信息,包括:确定各个法律相关文本的类型;根据所述各个法律相关文本的类型,通过预先构建的语义识别模型,识别确定所述多个法律相关文本中任一法律相关文本的至少一个要素信息。3.根据权利要求1或2所述的法律相关文本的归类方法,其特征在于,所述预先构建的语义识别模型包括要素信息的语义特征库,所述通过预先构建的语音识别模型,识别确定多个法律相关文本中任一法律相关文本的至少一个要素信息,包括:将所述多个法律相关文本中任一法律相关文本的相应文本内容与所述语义特征库进行匹配;如果所述相应文本内容与所述语义特征库匹配成功,则确定所述相应文本内容为所述法律相关文本的要素信息。4.根据权利要求1所述的法律相关文本的归类方法,其特征在于,该方法还包括:依据接收到的包括检索内容的检索请求,基于根据所述检索内容确定的索引关系,查找确定与所述检索内容相匹配的法律相关文本。5.根据权利要求4所述的法律相关文本的归类方法,其特征在于,所述依据接收到的包括检索内容的检索请求,基于所述索引关系,查找确定与所述检索内容相匹配的法律相关文本,包括:对所述检索内容进行语义识别,确定所述检索内容对应的法律相关文本的类别;基于确定的所述检索内容对应的法律相关文本的类别与法律相关文本的索引关...

【专利技术属性】
技术研发人员:孙理李倩谷博梁梦婕
申请(专利权)人:出门问问信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1