一种信息检索方法、装置、电子设备和存储介质制造方法及图纸

技术编号:29294238 阅读:12 留言:0更新日期:2021-07-17 00:45
本发明专利技术实施例提供了一种信息检索方法、装置、电子设备和计算机存储介质,所述方法包括:获取用户的法律咨询信息;识别所述法律咨询信息的第一数据,所述第一数据包括自然分词;基于预先构建的同义词库,将所述自然分词转换成第一法律关键词;所述同义词库表示法律专业词库中法律关键词对应的同义词的集合;基于所述第一法律关键词,得到所述法律咨询信息对应的法条信息。法条信息。法条信息。

The invention relates to an information retrieval method, a device, an electronic device and a storage medium

【技术实现步骤摘要】
一种信息检索方法、装置、电子设备和存储介质


[0001]本专利技术涉及法律应用场景下的语义识别
,尤其涉及一种信息检索方法、装置、电子设备和计算机存储介质。

技术介绍

[0002]在法律咨询场景中,为了让计算机读懂自然语言,通过构建两类语料的关系,即日常用语和法言法语之间的关系,达成日常用语和法言法语之间的互通。其中,词库的构建是两类语料转化的关键,特别是法律专业词库以及同义词库的构建。
[0003]相关技术中,对于词库的构建工作并未取得明显突破,使得两类语料转化的难度增加。另外,对于用户输入的法律咨询信息,计算机生成的反馈结果通常是其他律师或平台针对类似问题的解答回复,并非专业性的法律条文,降低问题咨询的准确性。

技术实现思路

[0004]本专利技术实施例提供了一种信息检索方法、装置、电子设备和计算机存储介质。
[0005]本专利技术实施例的技术方案是这样实现的:
[0006]本专利技术提供一种信息检索方法,所述方法包括:
[0007]获取用户的法律咨询信息;
[0008]识别所述法律咨询信息的第一数据,所述第一数据包括自然分词;
[0009]基于预先构建的同义词库,将所述自然分词转换成第一法律关键词;所述同义词库表示法律专业词库中法律关键词对应的同义词的集合;
[0010]基于所述第一法律关键词,得到所述法律咨询信息对应的法条信息。
[0011]在一些实施例中,所述法律专业词库的构建,包括:
[0012]获取法律法规中的法条;
[0013]从所述法条中提取所述第二法律关键词;
[0014]根据所述第二法律关键词和所述法条,构建法律专业词库。
[0015]在一些实施例中,从所述法条中提取所述第二法律关键词,包括:
[0016]采取正向最大匹配方法对所述法条进行切分,得到切分结果;
[0017]删除所述切分结果中与所述法条的主旨无关的分词,得到剩余分词;所述法条的主旨是预先设定的;
[0018]从所述剩余分词中提取所述第二法律关键词。
[0019]在一些实施例中,所述预先构建的同义词库是基于同义词模型确定的,所述同义词模型是通过以下步骤训练得到的:
[0020]采集语料信息;所述语料信息表示自然用语的语料;
[0021]将所述语料信息与法律文献语料进行合并,得到合并语料;
[0022]通过所述合并语料训练得到所述同义词模型。
[0023]在一些实施例中,所述基于所述第一法律关键词,得到所述法律咨询信息对应的
法条信息,包括:
[0024]使用目标法律关键词匹配所述法律专业词库中的法律关键词,得到词簇;所述目标法律关键词包括所述第一法律关键词;所述词簇包括与所述目标法律关键词相关的法律关键词;
[0025]使用所述词簇匹配所述法律专业词库中的法条,得到条簇;所述条簇包括与所述词簇相关的法条;
[0026]基于所述条簇,得到法律咨询信息对应的法条信息。
[0027]在一些实施例中,所述第一数据还包括第三法律关键词,所述目标法律关键词还包括所述第三法律关键词。
[0028]在一些实施例中,所述使用目标法律关键词匹配所述法律专业词库中的法律关键词,得到词簇,包括:
[0029]从所述法律关键词中获取支撑词;所述支撑词表示预设的具有代表意义的关键词;
[0030]所述使用目标法律关键词匹配所述法律专业词库中的支撑词,得到词簇;所述词簇包括与所述目标法律关键词相关的支撑词。
[0031]在一些实施例中,所述方法还包括:
[0032]按照所述词簇中关键词的数量,对所述法条信息进行排序,得到排序结果;
[0033]显示所述排序结果。
[0034]本专利技术提供一种信息检索装置,所述装置包括:
[0035]获取模块,用于获取用户的法律咨询信息;
[0036]识别模块,用于识别所述法律咨询信息的第一数据,所述第一数据包括自然分词;
[0037]转换模块,用于基于预先构建的同义词库,将所述自然分词转换成第一法律关键词;所述同义词库表示法律专业词库中法律关键词对应的同义词的集合;
[0038]确定模块,用于基于所述第一法律关键词,得到所述法律咨询信息对应的法条信息。
[0039]在一些实施例中,所述装置还包括构建模块,所述构建模块,用于:
[0040]获取法律法规中的法条;
[0041]从所述法条中提取所述第二法律关键词;
[0042]根据所述第二法律关键词和所述法条,构建法律专业词库。
[0043]在一些实施例中,所述构建模块,用于从所述法条中提取所述第二法律关键词,包括:
[0044]采取正向最大匹配方法对所述法条进行切分,得到切分结果;
[0045]删除所述切分结果中与所述法条的主旨无关的分词,得到剩余分词;所述法条的主旨是预先设定的;
[0046]从所述剩余分词中提取所述第二法律关键词。
[0047]在一些实施例中,所述预先构建的同义词库是基于同义词模型确定的,所述同义词模型是通过以下步骤训练得到的:
[0048]采集语料信息;所述语料信息表示自然用语的语料;
[0049]将所述语料信息与法律文献语料进行合并,得到合并语料;
[0050]通过所述合并语料训练得到所述同义词模型。
[0051]在一些实施例中,所述确定模块,用于所述基于所述第一法律关键词,得到所述法律咨询信息对应的法条信息,包括:
[0052]使用目标法律关键词匹配所述法律专业词库中的法律关键词,得到词簇;所述目标法律关键词包括所述第一法律关键词;所述词簇包括与所述目标法律关键词相关的法律关键词;
[0053]使用所述词簇匹配所述法律专业词库中的法条,得到条簇;所述条簇包括与所述词簇相关的法条;
[0054]基于所述条簇,得到法律咨询信息对应的法条信息。
[0055]在一些实施例中,所述第一数据还包括第三法律关键词,所述目标法律关键词还包括所述第三法律关键词。
[0056]在一些实施例中,所述确定模块,用于所述使用目标法律关键词匹配所述法律专业词库中的法律关键词,得到词簇,包括:
[0057]从所述法律关键词中获取支撑词;所述支撑词表示预设的具有代表意义的关键词;
[0058]所述使用目标法律关键词匹配所述法律专业词库中的支撑词,得到词簇;所述词簇包括与所述目标法律关键词相关的支撑词。
[0059]在一些实施例中,所述确定模块,还用于:
[0060]按照所述词簇中关键词的数量,对所述法条信息进行排序,得到排序结果;
[0061]显示所述排序结果。
[0062]本专利技术提供一种电子设备,所述设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述一个或多个技术方案提供的信息检索方法。...

【技术保护点】

【技术特征摘要】
1.一种信息检索方法,其特征在于,所述方法包括:获取用户的法律咨询信息;识别所述法律咨询信息的第一数据,所述第一数据包括自然分词;基于预先构建的同义词库,将所述自然分词转换成第一法律关键词;所述同义词库表示法律专业词库中法律关键词对应的同义词的集合;基于所述第一法律关键词,得到所述法律咨询信息对应的法条信息。2.根据权利要求1所述的方法,其特征在于,所述法律专业词库的构建,包括:获取法律法规中的法条;从所述法条中提取第二法律关键词;根据所述第二法律关键词和所述法条,构建法律专业词库。3.根据权利要求2所述的方法,其特征在于,从所述法条中提取所述第二法律关键词,包括:采取正向最大匹配方法对所述法条进行切分,得到切分结果;删除所述切分结果中与所述法条的主旨无关的分词,得到剩余分词;所述法条的主旨是预先设定的;从所述剩余分词中提取所述第二法律关键词。4.根据权利要求1所述的方法,其特征在于,所述预先构建的同义词库是基于同义词模型确定的,所述同义词模型是通过以下步骤训练得到的:采集语料信息;所述语料信息表示自然用语的语料;将所述语料信息与法律文献语料进行合并,得到合并语料;通过所述合并语料训练得到所述同义词模型。5.根据权利要求1所述的方法,其特征在于,所述基于所述第一法律关键词,得到所述法律咨询信息对应的法条信息,包括:使用目标法律关键词匹配所述法律专业词库中的法律关键词,得到词簇;所述目标法律关键词包括所述第一法律关键词;所述词簇包括与所述目标法律关键词相关的法律关键词;使用所述词簇匹配所述法律专业词库中的法条,得到条簇;所...

【专利技术属性】
技术研发人员:傅文武刘清伟刘彦军王越
申请(专利权)人:北京法集科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1