【技术实现步骤摘要】
文本信息的处理方法、装置、存储介质和处理器
[0001]本专利技术涉及文本信息处理领域,具体而言,涉及一种文本信息的处理方法、装置、存储介质和处理器。
技术介绍
[0002]目前,随着人们法律意识的增强,案件也越来越多,尤其是民事案件数量居高不下,最高法院也鼓励更多的民事案件进入多元调解纠纷阶段。但是,目前通常是人工根据案件的实际情况进行调解,耗时较长,并没有在诉讼场景中对案情的诉讼结果和所使用的法律信息进行预测的方案,从而存在对案情进行审理的效率低下的技术问题。
[0003]针对上述的由于在诉讼场景中无法对案件的诉讼结果和所使用的法律信息进行预测,所导致的对诉讼场景中的案件进行处理的效率低下的问题,目前尚未提出有效的解决方案。
技术实现思路
[0004]本专利技术实施例提供了一种文本信息的处理方法、装置、存储介质和处理器,以至少解决由于在诉讼场景中无法对案件的诉讼结果和所使用的法律信息进行预测,所导致的对诉讼场景中的案件进行处理的效率低下的技术问题。
[0005]根据本专利技术实施例的一个方面,提供了一种文本信息的处理方法。该方法包括:获取目标文本信息,其中,目标文本信息用于描述诉讼场景中的案件的案件信息;基于多任务预测模型对目标文本信息进行预测处理,预测得到案件的法律信息和诉讼预测信息,其中,多任务预测模型通过用于描述诉讼场景中的案件样本的案件信息的文本信息和案件样本的法律信息样本进行训练得到;输出案件的法律信息和诉讼预测信息。
[0006]根据本专利技术实施例的另一方面,
【技术保护点】
【技术特征摘要】
1.一种文本信息的处理方法,其特征在于,包括:获取目标文本信息,其中,所述目标文本信息用于描述诉讼场景中的案件的案件信息;基于多任务预测模型对所述目标文本信息进行预测处理,预测得到所述案件的法律信息和诉讼预测信息,其中,所述多任务预测模型通过用于描述所述诉讼场景中的案件样本的案件信息的文本信息和所述案件样本的法律信息样本进行训练得到;输出所述案件的法律信息和诉讼预测信息。2.根据权利要求1所述的方法,其特征在于,在基于多任务预测模型对所述目标文本信息进行处理,得到所述案件的法律信息和诉讼预测信息之前,所述方法还包括:通过所述法律信息样本和所述案件样本的文本信息进行训练,得到第一任务预测模型,其中,所述多任务预测模型包括所述第一任务预测模型,所述第一任务预测模型用于预测所述案件的法律信息;通过所述法律信息样本、所述案件样本的文本信息和所述第一任务预测模型输出的法律信息进行训练,得到第二任务预测模型,其中,所述多任务预测模型包括所述第二任务预测模型,所述第二任务预测模型用于预测所述案件的诉讼预测信息。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:对所述法律信息样本进行编码,得到第一编码结果;对所述案件样本的文本信息进行编码,得到第二编码结果;对所述案件样本的文本信息的离散特征进行编码,得到第三编码结果;通过所述法律信息样本和所述案件样本的文本信息进行训练,得到第一任务预测模型包括:通过所述第一编码结果、所述第二编码结果和所述第三编码结果进行训练,得到所述第一任务预测模型,其中,所述第一编码结果、所述第二编码结果和所述第三编码结果为所述第一任务预测模型的输入层的结果;通过所述法律信息样本、所述案件样本的文本信息和所述第一任务预测模型输出的法律信息进行训练,得到第二任务预测模型包括:通过所述第一编码结果、所述第二编码结果、所述第三编码结果和所述第一任务预测模型输出的法律信息进行训练,得到所述第二任务预测模型,其中,所述第一编码结果、所述第二编码结果和所述第三编码结果为所述第二任务预测模型的输入层的结果。4.根据权利要求3所述的方法,其特征在于,对所述法律信息样本进行编码,得到第一编码结果包括:对所述法律信息样本进行分词,得到第一词向量序列;将所述第一词向量序列确定为所述第一编码结果。5.根据权利要求3所述的方法,其特征在于,对所述案件样本的文本信息进行编码,得到第二编码结果包括:对所述案件样本的文本信息进行分词,得到第二词向量序列;对所述第二词向量序列进行编码,得到所述第二编码结果。6.根据权利要求3所述的方法,其特征在于,对所述案件样本的文本信息的离散特征进行编码,得到第三编码结果包括:通过多层感知器对所述离散特征进行编码,得到具有连续语义的第三编码结果。7.根据权利要求3所述的方法,其特征在于,通过所述第一编码结果、所述第二编码结
果和所述第三编码结果进行训练,得到所述第一任务预测模型包括:对所述第二编码结果和所述第三编码结果进行融合编码,得到第四编码结果;将所述第四编码结果和所述第一编码结果进行拼接,得到第五编码结果;通过所述第五编码结果进行训练,得到所述第一任务预测模型,其中,所述第五编码结果为所述第一任务预测模型的中间层的结果。8.根据权利要求7所述的方法,其特征在于,通过所述第五编码结果进行训练,得到所述第一任务预测模型包括:通过所述第五编码结果和目标函数确定所述第一任务预测模型的输出层,得到所述第一任务预测模型。9.根据权利要求3所述的方法,其特征在于,通过所述第一编码结果、所述第二编码结果、所述第三编码结果和所述第一任务预测模型输出的法律信息进行训练,得到所述第二任务预测模型包括:通过预先构建的所述法律信息样本的分类器,对所述第一编码结果进行分类,得到分类结果;对所述分类结果、用于得到所述分类结果的中间分类结果、所述第二编码结果和所述第三编码结果进行拼接,得到拼接结果;对所述拼接结果进行融合编码,得到第六编码结果,其中,所述第六编码结果为所述第二任务预测模型的中间层的结果;通过所述第六编码结果和所述第一任务预测模型输出的法律信息进行训练,得到所述第二任务预测模型。10.根据权利要求9所述的方法,其特征在于,通过所述第六编码结果和所述第一任务预测模型输出的法律信息进行训练,得到所述第二任务预测模型包括:通过所述第六编码结果和目标函数确定所述第二任务预测模型的输出层;通过所述第一任务预测模型输出的法律信息对所述第二任务预测模型的输出层进行训练,得到所述第二任务预测模型。11.根据权利要求10所述的方法,其特征在于,通过所述第一任务预测模型输出的法律信息对所述第二任务预测模型的输出层进行训练,得到所述第二任务预测模型包括:获取所述第一任务预测模型输出的法律信息对应的第一损失函数;获取所述第二任务预测模型的输出层对应的第二损失函数;通过所述第一损失函数和所述第二损失函数对所述第二任务预测模型的输出层进行训练,得到所述第二任务预测模型。12.根据权利要求2至11中任意一项所述的方法,其特征在于,所述方法还包括:从所述案件样本的文本信息中提取词的统计特征和词的向量特征;通过所述法律信息样本和所述案件样本的文本信息进行训练,得到第一任务预测模型包括:通过所述法律信息样本、所述词的统计特征和所述词的向量特征进行训练,得到所述第一任务预测模型;通过所述法律信息样本、所述案件样本的文本信息和所述第一任务预测模型输出的法律信息进行训练,得到第二任务预测模型包括:通过所述法律信息样本、所述词的统计特征、所述词的向量特征和所述第一任务预测模型输出的法律信息进行训练,得到所述第二
任务预测模型。13.一种文本信息的处理方法,其特征在于,包括:在文本显示界面显示目标文本信息,其中,所述目标文...
【专利技术属性】
技术研发人员:周鑫,张雅婷,孙常龙,张琼,司罗,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。