【技术实现步骤摘要】
金额信息的提取方法、终端设备及介质
本专利技术属于信息处理
,尤其涉及一种金额信息的提取方法、终端设备及计算机可读存储介质。
技术介绍
司法行政机关及当事人、律师等在解决诉讼和非讼案件时所使用的文书为法律文书。法律文书往往记载有不同费用项的原告诉请金额、判决金额等金额数据信息。这些金额数据信息在自动断案、案件预判、律师画像、律师胜诉率分析以及判决合理性分析等方面均起着极为重要的参考作用。然而,基于法律文书的描述多样性,不同机关所对应发布的法律文书的样式差异较大,因此,若要提取法律文书中的金额数据信息,则目前用户也只能通过人工读取的方式来实现。然而,当法律文书所记载的费用项较多时,用户依次遍历法律文书中的各个字符需要耗费较多的时间,由此使得金额信息的提取效率较为低下。并且,在法律文书的读取过程中,或多或少地会出现人工识读出错的情况,因而也降低了金额信息的识别准确率。
技术实现思路
有鉴于此,本专利技术实施例提供了一种金额信息的提取方法、终端设备及计算机可读存储介质,以解决现有技术中金额信息的识别准确率以及提取效率均较为低下的问题。本专利技术实施例的第一方面提供了一种金额信息的提取方法,包括:根据法律文书的案由类别以及发行区域,获取所述法律文书的文本类型;在预设的多个识别算法中,确定出与所述文本类型匹配的所述识别算法,并基于确定出的所述识别算法,提取所述法律文书中的各个费用项以及与每一个所述费用项相对应的金额值;加载报告模板,并根据所述报告模板中预先设置好的表头,将所述费用项及所述金额值导入对应的表体中;根据所述报告模板的导入结果计算表尾,输出关于所述法律文 ...
【技术保护点】
1.一种金额信息的提取方法,其特征在于,包括:根据法律文书的案由类别以及发行区域,获取所述法律文书的文本类型;在预设的多个识别算法中,确定出与所述文本类型匹配的所述识别算法,并基于确定出的所述识别算法,提取所述法律文书中的各个费用项以及与每一个所述费用项相对应的金额值;加载报告模板,并根据所述报告模板中预先设置好的表头,将所述费用项及所述金额值导入对应的表体中;根据所述报告模板的导入结果计算表尾,输出关于所述法律文书的金额信息提取报表。
【技术特征摘要】
1.一种金额信息的提取方法,其特征在于,包括:根据法律文书的案由类别以及发行区域,获取所述法律文书的文本类型;在预设的多个识别算法中,确定出与所述文本类型匹配的所述识别算法,并基于确定出的所述识别算法,提取所述法律文书中的各个费用项以及与每一个所述费用项相对应的金额值;加载报告模板,并根据所述报告模板中预先设置好的表头,将所述费用项及所述金额值导入对应的表体中;根据所述报告模板的导入结果计算表尾,输出关于所述法律文书的金额信息提取报表。2.如权利要求1所述的金额信息的提取方法,其特征在于,若确定出的所述识别算法为第一算法,则所述提取所述法律文书中的各个费用项以及与每一个所述费用项对应的金额值,包括:获取与费用项描述信息相关联的第一正则表达式;在所述法律文书中,定位与所述第一正则表达式匹配的各个所述费用项;对定位出的每一个所述费用项,查找所述法律文书中出现在该费用项之后的首个金额值,并将该费用项以及该金额值的对应关系进行提取。3.如权利要求1所述的金额信息的提取方法,其特征在于,若确定出的所述识别算法为第二算法,则所述提取所述法律文书中的各个费用项以及与每一个所述费用项对应的金额值,包括:获取包含依序排列的多个费用项的信息列表以及与各类金额值关联的第二正则表达式;在所述法律文书中,定位与所述第二正则表达式匹配的各个所述金额值;对于每相邻的两个所述金额值之间所存在的文本区域,依序读取所述信息列表中的所述费用项,并判断所述文本区域中是否存在该费用项;若所述文本区域中存在该费用项,则在所述相邻的两个所述金额值中,选取排序在后的金额值,并在将该费用项以及该金额值的对应关系进行提取后,停止读取所述信息列表中的所述费用项。4.如权利要求3所述的金额信息的提取方法,其特征在于,还包括:若所述文本区域中不存在所述信息列表中的任一所述费用项,则在所述相邻的两个所述金额值中,选取排序在后的金额值,并读取位于该金额值之前的N个字符;其中,所述N为大于零的整数,且所述N为预设值;通过预设的自然语言处理算法,分别对各个所述字符进行实体标注处理;获取用户分别对各个所述字符设置的费用项名称;基于各个所述字符所分别对应的所述实体标注以及所述费用项名称,构建并训练神经网络模型;在每相邻的两个所述金额值之间的文本区域中,若再次检测到所述文本区域中未存在所述信息列表中的任一所述费用项,则通过所述神经网络模型,输出与排序在后的所述金额值相对应的所述费用项。5.如权利要求1所述的金额信息的提取方法,其特征在于,还包括:获取与信息变更事件关联的关键词;对所述法律文书进行检测处理,判断所述法律文书中是否存在所述关键词;若所述法律文书中存在所述关键词,则提取出与所述关键词邻近的所述费用项以及所述金额值,并在所述金额信息提取报表中,将该费用项所对应的金额值变更为当前...
【专利技术属性】
技术研发人员:苏晓明,汪伟,王晓伟,刘媛源,肖京,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。