基于案事件知识图谱的语义搜索方法、装置和电子设备制造方法及图纸

技术编号:28035436 阅读:69 留言:0更新日期:2021-04-09 23:17
本说明书一个或多个实施例提供一种基于案事件知识图谱的语义搜索方法、装置和电子设备,对用户输入的法律案事件问题首先进行预处理,然后对所述法律案事件问题的描述进行信息抽取和信息融合;基于案事件类型标签对所述描述进行分类,输出带有案事件类型标签的语义搜索图;将所述语义搜索图与法律案事件知识图谱进行子图匹配,输出法律案事件答案数据。本发明专利技术通过对用户问题建立语义网,并结合案事件知识图谱进行匹配和推理,能够准确捕捉用户的搜索意图,从而直接给出满足用户搜索意图的答案,实际解决用户的法律问题。

【技术实现步骤摘要】
基于案事件知识图谱的语义搜索方法、装置和电子设备
本说明书一个或多个实施例涉及知识图谱
,尤其涉及一种基于案事件知识图谱的语义搜索方法、装置和电子设备。
技术介绍
随着科技的发展,人工智能正在推动司法的改革。面对海量的裁判文书等法律资源,如果能让机器对案件进行一定程度的理解和认知,将会很大程度的解放人力,并将在类案搜索、类案精准推送等司法应用场景中发挥重要的作用。传统的法律案事件搜索系统大多基于关键词匹配技术或案事件分类,返回的结果主要依据用户输入素材中是否存在相关的法律关键词或直接对用户输入进行粗糙的分类并基于该分类结果直接返回属于该类别的所有案例。这种搜索系统并不能理解用户搜索语句的真正含义,返回的案例往往范围太广甚至完全不准确,这与用户对精准返回相关案事件的需求相矛盾。基于此,需要一种能够为民众提供精准的类案搜索结果和相关案情分析的语义搜索方法。
技术实现思路
有鉴于此,本说明书一个或多个实施例的目的在于提出一种基于案事件知识图谱的语义搜索方法、装置和电子设备,以解决传统的法律案事件搜索系统不能准本文档来自技高网...

【技术保护点】
1.一种基于案事件知识图谱的语义搜索方法,其特征在于,包括:/n响应于接收到用户输入的法律案事件问题的描述,对所述描述进行预处理;/n通过Balanced-TPLinker模型对所述描述进行实体、实体关系、事件触发词、事件角色和论元的提取,以所述实体、事件触发词和论元作为节点,以所述实体关系和事件角色作为边构建语义搜索图,对所述描述进行案事件类型分类并得到所述描述的案事件类型分类标签集合,结合所述语义搜索图得到一个带有至少一个案事件类型分类标签的语义搜索图;/n将所述带有案事件类型分类标签的语义搜索图与预先基于法律案事件相关文件构建的法律案事件知识图谱进行子图匹配,输出与所述描述相关的法律案事...

【技术特征摘要】
1.一种基于案事件知识图谱的语义搜索方法,其特征在于,包括:
响应于接收到用户输入的法律案事件问题的描述,对所述描述进行预处理;
通过Balanced-TPLinker模型对所述描述进行实体、实体关系、事件触发词、事件角色和论元的提取,以所述实体、事件触发词和论元作为节点,以所述实体关系和事件角色作为边构建语义搜索图,对所述描述进行案事件类型分类并得到所述描述的案事件类型分类标签集合,结合所述语义搜索图得到一个带有至少一个案事件类型分类标签的语义搜索图;
将所述带有案事件类型分类标签的语义搜索图与预先基于法律案事件相关文件构建的法律案事件知识图谱进行子图匹配,输出与所述描述相关的法律案事件候选答案数据集;
输出所述法律案事件候选答案数据集中的至少一个作为与所述描述相关的法律案事件答案数据。


2.根据权利要求1所述的语义搜索方法,其特征在于,响应于接受到用户输入的法律案事件问题的描述,对所述描述进行预处理包括下列中至少一个:
通过正则表达式去除所述描述的标点符号和/或特殊符号;
将所述描述中的繁简字体进行统一化;
通过中文分词算法WMSeg对所述描述进行分词;
通过标准表达方式对所述描述进行同义词归一化;
通过Soft-MaskedBERT模型对所述描述进行文本纠错处理。


3.根据权利要求1或2所述的语义搜索方法,其特征在于,通过Balanced-TPLinker模型对所述描述进行实体、实体关系、事件触发词、事件角色和论元的提取,以所述实体、事件触发词和论元作为节点,以所述实体关系和事件角色作为边构建语义搜索图,包括:
通过Balanced-TPLinker模型对所述描述进行三元组抽取,得到两个三元组集合,所述两个三元组集合分别为“主体-关系-客体”三元组集合和“事件触发词-事件角色-论元”三元组集合,将所述两个三元组集合通过正则匹配进行融合拼接,基于经过所述融合拼接的两个三元组构建语义搜索图。


4.根据权利要求1或2所述的语义搜索方法,其特征在于,对所述描述进行案事件类型分类并得到所述描述的案事件类型分类标签集合,结合所述语义搜索图得到一个带有至少一个案事件类型分类标签的语义搜索图,包括:
通过BERT-Chinese预训练模型得到所述描述的词向量表示,对于给定的一个预设分类标签,求其向量表示和每个所述词向量表示的相似度,以所述相似度作为权重系数对所述词向量表示进行加权求和得到...

【专利技术属性】
技术研发人员:朵思惟余梓飞张程华薛晨云
申请(专利权)人:天津汇智星源信息技术有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1