【技术实现步骤摘要】
类案推荐方法及相关装置
[0001]本申请属于文本处理
,具体涉及一种类案推荐方法及相关装置。
技术介绍
[0002]类案推荐指的是用户输入一句、一段甚至几段案情事实,类案推荐系统通过将其与案例数据库中的海量历史案例进行匹配,返回相似度较高的若干历史案例,并按照相似度从大到小的顺序展示给用户。
[0003]从技术角度讲,类案推荐实质是一个文本匹配的任务,其核心的难点在于用户输入的案情事实有时高达几百字,而案例数据库中的历史案例的平均字数更是高达上千。传统的文本匹配技术方案在类案推荐场景中并不合适。
技术实现思路
[0004]本申请提供一种类案推荐方法及相关装置,能够将用户输入的案件文本解析形成统一的结构化表示形式,以获得更好的推荐结果。
[0005]为解决上述技术问题,本申请采用的一个技术方案是:提供一种类案推荐方法,包括:获得用户输入的案件文本,并对所述案件文本进行模块抽取以获得所述案件文本所包含的所有模块以及每个所述模块的模块内容;基于所述案件文本的所有所述模块的模块内容确定所述模块 ...
【技术保护点】
【技术特征摘要】
1.一种类案推荐方法,其特征在于,包括:获得用户输入的案件文本,并对所述案件文本进行模块抽取以获得所述案件文本所包含的所有模块以及每个所述模块的模块内容;基于所述案件文本的所有所述模块的模块内容确定所述模块之间的关联关系,以构建结构化后的所述案件文本;获得结构化后的所述案件文本中各个模块的向量化表示,并基于所述向量化表示从案例数据库中获得与所述案件文本相似的历史案例。2.根据权利要求1所述的类案推荐方法,其特征在于,所述对所述案件文本进行模块抽取以获得所述案件文本所包含的所有模块以及每个所述模块的模块内容的步骤,包括:获得与所述案件文本的领域相关的所有模块;针对每个所述模块,将所述模块的名称和所述案件文本输入至训练后的模块抽取模型中以获得所述模块的模块内容。3.根据权利要求2所述的类案推荐方法,其特征在于,所述模块抽取模型包括第一预训练模型和两个第一全连接层;且所述第一预训练模型的输出分别与两个所述第一全连接层的输入连接;训练所述模块抽取模型的过程包括:构建第一训练集;其中,所述第一训练集中包含多个第一训练文本,且所述第一训练文本与所述案件文本所处领域相同,所述第一训练文本中标注有各个模块的位置标签;将任一模块的名称和所述第一训练文本输入至所述第一预训练模型中以获得隐层表示;将所述隐层表示分别输入至两个第一全连接层后分别获得所述模块在所述第一训练文本中的预测起始位置和预测终止位置;基于与同一模块相关的所述预测起始位置、所述预测终止位置和所述位置标签调整所述模块抽取模型的参数。4.根据权利要求1所述的类案推荐方法,其特征在于,所述基于所述案件文本的所有所述模块的模块内容确定所述模块之间的关联关系的步骤,包括:获得所述案件文本中所有所述模块所形成的模块对;其中,每个所述模块对包含两个所述模块;针对每个所述模块对,将所述模块对中的两个所述模块的模块内容输入至训练后的模块关联模型中以获得当前所述模块对中两个所述模块之间的关联概率;将所述关联概率超过阈值的所述模块对中的两个所述模块确定为具有关联关系。5.根据权利要求4所述的类案推荐方法,其特征在于,所述模块关联模型包括第二预训练模型、两个第二全连接层和两个自注意力层;且所述第二预训练模型的输出分别与两个所述第二全连接层的输入连接,一个所述第二全连接层的输出与一个所述自注意力层的输入连接;训练所述模块关联模型的过程包括:构建第二训练集;其中,所述第二训练集中包含多个第二训练文本,且所述第二训练文本与所述案件文本所处领域相同,所述第二训练文本中标注有其所包含的各个模块对的模块内容的实际关联概率;其中,所述实际关联概率为1或0;将所述第二训练文本中同一所述模块对中的两个模块的模块内容输入至所述第二预训练模型中以分别获得第一隐层表示和第二隐层表示;
将所述第一隐层表示经过其中一个所述第二全连接层和其中一个所述自注意力层以获得第一模块表示、以及将所述第二隐层表示经过另一个所述第二全连接层和另一个所述自注意力层以获得第二模块表示;基于所述第一模块表示和所述第二模块表示获得预测关联概率;基于所述预测关联概率和所述实际关联概率调整所述模块关联模型中的参数。6.根据权利要求5所述的类案推荐方法,其特征在于,将所述第二训练文本中同一所述模块对中的两个模块的模块内容输入至所述第二预训练模型中时,将其中一个模块的模块内容中的第一模块要素标记为1,将所述其中一个模块的模块内容中所述第一模块要...
【专利技术属性】
技术研发人员:郭冬杰,李宝善,盛志超,李浩,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。