生成法律文书的方法、装置、设备和存储介质制造方法及图纸

技术编号:23559350 阅读:30 留言:0更新日期:2020-03-25 04:39
本申请涉及人工智能领域,提供了一种生成法律文书的方法、装置、设备和存储介质,方法包括:接收用户输入的语音数据;将语音数据通过语音转换技术转换成待处理的文本数据;创建图Graph数据,通过图Graph数据辨识特定的分隔符,以分句处理待处理的文本,通过图Graph数据的节点保存多个候选关键句;将多个候选关键句输入至分词模型,以得到分词后的词汇;构建边集E,通过边集E以及文本句子的内容覆盖率,以计算任意两个候选关键句以及的权重,并将权重高于阈值的候选关键句链接起来;分析权重高于阈值的候选关键句的重要性;对候选关键句进行排序,并按顺序提取候选关键句,以得到多个文摘句子。最大化的减少重复劳动,提高办案效率。

Methods, devices, equipment and storage media for generating legal documents

【技术实现步骤摘要】
生成法律文书的方法、装置、设备和存储介质
本申请涉及智能决策领域,尤其涉及一种生成法律文书的方法、装置、设备和存储介质。
技术介绍
法律文书是记载人民法院审理过程和结果的载体,一份结构完整、要素齐全、逻辑严谨的法律摘要,既是当事人享有权利和负担义务的凭证,也是上级人民法院监督下级人民法院民事审判活动的重要依据。但法律文摘的书写过程繁杂而冗长,并带有大量的重复性劳动。通过法律知识图谱对案件中原告、被告以及证据项等关键节点的解析进而自动生成法律文摘可以提高审案效率将法官从书写文摘的工作中解放出来。现有的法律文摘自动生成系统中,用户需要根据固定模板中关键词对应的内容进行填写进行法律文摘的初步生成,基于固定模板的文书生产方式对于案件由来和审理经过、事实、理由、裁判依据部分的书写均不能起到很好的效果,依然需要用户进行大量的内容填写,并且大量填写的内容不一定能符合法律要求所需要的形式。
技术实现思路
本申请提供了一种通过配置生成法律文书的方法,能够解决现法律文摘的书写过程繁杂而冗长的问题。第一方面,本申请提供一种生成法律本文档来自技高网...

【技术保护点】
1.一种生成法律文书的方法,其特征在于,所述方法包括:/n接收用户输入的语音数据;/n将所述语音数据通过语音转换技术转换成待处理的文本数据;/n创建图Graph数据,通过所述图Graph数据辨识特定的分隔符,以分句处理所述待处理的文本数据,并通过所述图Graph数据的节点保存多个候选关键句;/n将所述多个候选关键句输入至分词模型,以得到分词后的词汇;/n构建边集E,通过所述边集E以及文本句子的内容覆盖率,计算任意两个所述候选关键句S

【技术特征摘要】
1.一种生成法律文书的方法,其特征在于,所述方法包括:
接收用户输入的语音数据;
将所述语音数据通过语音转换技术转换成待处理的文本数据;
创建图Graph数据,通过所述图Graph数据辨识特定的分隔符,以分句处理所述待处理的文本数据,并通过所述图Graph数据的节点保存多个候选关键句;
将所述多个候选关键句输入至分词模型,以得到分词后的词汇;
构建边集E,通过所述边集E以及文本句子的内容覆盖率,计算任意两个所述候选关键句Si以及所述候选关键句Sj的权重,并将所述权重高于阈值的所述候选关键句链接起来;
分析所述权重高于阈值的候选关键句的重要性,重复计算多次,直至计算前的S(Vi)以及计算后的S(Vi)之间差值小于阈值,S(Vi)表示第i个所述节点Vi的重要性,Vj表示与所述第i个节点相连的第j个节点;
根据计算的每一个所述候选句S(Vi)的值,将所述多个候选关键句按照S(Vi)的值从大到小排序,并按顺序提取多个所述候选关键句,以得到多个文摘句子;
根据句子要求以及字数要求,从所述多个文摘句子中抽取句子组成文摘。


2.根据权利要求1所述的方法,其特征在于,所述接收用户输入的语音数据之前,所述方法还包括:
获取针对所述分词模型输出的反馈信息;
根据所述反馈信息对所述分词模型进行优化;
采集具有多元语义的网络词库,根据法律领域对网络词库进行训练;
接收待分词文本,根据所述网络词库对所述待分词文本进行初始分词;
对所述待分词文本进行初始分词后,对所述待分词文本进行特征提取,从而获得所述待分词文本的领域特征;
根据所述待分词文本的领域特征,对所述待分词文本的词条进行权重调整从而获得所述分词模型。


3.根据权利要求2所述的方法,其特征在于,所述根据所述待分词文本的领域特征,对所述待分词文本的词条进行权重调整从而获得分词模型,包括:
根据法律领域的词语特征标注所述网络词库,得到标注好的网络词库;
将所述标注好的网络词库输入至所述分词模型;
通过训练所述分词模型,其中,代表根据所述分词模型神经网络层的多层感知器中第n-1层的输出,训练所述分词模型神经网络层的多层感知器中第n层中第k个神经元得到的权值,表示相应的偏置,fin表示第i个训练数据输入至所述分词模型后在所述分词模型的第n层的输出,i、j以及k为任意正整数,n为自然数;当n为所述分词模型的最后一层时,fin是指所述分词模型的输出。


4.根据权利要求1所述的方法,其特征在于,所述接收用户输入的语音数据,包括:
接收所述用户的采集请求;
根据所述采集请求采集多个语音测试数据;
对所述多个语音测试数据进行语音活动检测,获得所述多个语音测试数据的语音指标检测结果;
根据所述语音指标检测结果调整所述用户输入的语音数据的指标阈值;
保存调整后的所述指标阈值;
接收所...

【专利技术属性】
技术研发人员:张学晨刘嘉伟于修铭陈晨李可汪伟
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1