信息抽取方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:25479608 阅读:22 留言:0更新日期:2020-09-01 23:00
本申请涉及一种信息抽取方法、装置、计算机设备和存储介质,所述方法包括:获取犯罪事实文本,提取犯罪事实文本的罪名要件对应的候选关键词,获取罪名要件对应的候选关键词的位置信息,根据候选关键词的位置信息重组候选关键词,得到重组语段,提取重组语段中罪名要件对应的目标关键词,目标关键词用于对犯罪事实文本对应的罪名进行预判。通过对犯罪事实文本进行信息抽取,得到用于进行罪名判定的罪名要件,对罪名要件对应的候选关键词进行重组,并提取重组后的罪名要件,减少信息冗余,且删除逻辑上不成立的候选关键词,得到逻辑更为严谨的目标关键词,使得提取的信息更为准确,采用准确的信息能够更好对主体的犯罪事实进行判定。

【技术实现步骤摘要】
信息抽取方法、装置、计算机设备和存储介质
本申请涉及计算机
,尤其涉及一种信息抽取方法、装置、计算机设备和存储介质。
技术介绍
近年来,随着人工智能技术的日趋成熟,很多领域,比如自然语言处理,语音识别,垃圾邮件过滤,机器翻译,广告推荐等等,都利用人工智能技术得到了迅猛的发展。而在法律方面,与人工智能的结合较少,法务工作大多还是以人力为主。法律属于专业性很强的领域,非专业人士往往不能通过查询资料而获得期望的法律知识,而依靠专业的法律咨询既费时间又费钱财。另一方面,对于法律工作者本身而言,拥有的法律知识以及案例知识是有限的,有某些特殊情况下也需要借助其它渠道获取帮助,目前还没有一种快捷方式能够帮助大家较为准确的判定各个案例的罪名。
技术实现思路
为了解决上述技术问题,本申请提供了一种信息抽取方法、装置、计算机设备和存储介质。第一方面,本申请提供了一种信息抽取方法,包括:获取犯罪事实文本;提取犯罪事实文本的罪名要件对应的候选关键词;获取罪名要件对应的候选关键词的位置信息,根据候选关键词的位置信息重组候选关键词,得到重组语段;提取重组语段中罪名要件对应的目标关键词,目标关键词用于对犯罪事实文本对应的罪名进行预判。第二方面,本申请提供了一种信息抽取装置,包括:文本获取模块,用于获取犯罪事实文本;候选关键词提取模块,用于提取犯罪事实文本的罪名要件对应的候选关键词;关键词重组模块,用于获取罪名要件对应的候选关键词的位置信息,根据候选关键词的位置信息重组候选关键词,得到重组语段;目标关键词提取模块,用于提取重组语段中罪名要件对应的目标关键词,目标关键词用于对犯罪事实文本对应的罪名进行预判。一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取犯罪事实文本;提取犯罪事实文本的罪名要件对应的候选关键词;获取罪名要件对应的候选关键词的位置信息,根据候选关键词的位置信息重组候选关键词,得到重组语段;提取重组语段中罪名要件对应的目标关键词,目标关键词用于对犯罪事实文本对应的罪名进行预判。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取犯罪事实文本;提取犯罪事实文本的罪名要件对应的候选关键词;获取罪名要件对应的候选关键词的位置信息,根据候选关键词的位置信息重组候选关键词,得到重组语段;提取重组语段中罪名要件对应的目标关键词,目标关键词用于对犯罪事实文本对应的罪名进行预判。上述信息抽取方法、装置、计算机设备和存储介质,所述方法包括:获取犯罪事实文本,提取犯罪事实文本的罪名要件对应的候选关键词,获取罪名要件对应的候选关键词的位置信息,根据候选关键词的位置信息重组候选关键词,得到重组语段,提取重组语段中罪名要件对应的目标关键词,目标关键词用于对犯罪事实文本对应的罪名进行预判。通过对犯罪事实文本进行信息抽取,得到用于进行罪名判定的罪名要件,对罪名要件对应的候选关键词进行重组,并提取重组后的罪名要件,能够减少信息冗余,且删除逻辑上不成立的候选关键词,得到逻辑更为严谨的目标关键词,使得提取的信息更为准确,采用准确的信息能够更好对主体的犯罪事实进行判定。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为一个实施例中信息抽取方法的应用环境图;图2为一个实施例中信息抽取方法的流程示意图;图3为一个实施例中信息抽取装置的结构框图;图4为一个实施例中计算机设备的内部结构图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。图1为一个实施例中信息抽取方法的应用环境图。参照图1,该信息抽取方法应用于信息抽取系统。该信息抽取系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端或服务器获取犯罪事实文本,提取犯罪事实文本的罪名要件对应的候选关键词,获取罪名要件对应的候选关键词的位置信息,根据候选关键词的位置信息重组候选关键词,得到重组语段,提取重组语段中罪名要件对应的目标关键词,目标关键词用于对犯罪事实文本对应的罪名进行预判。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。如图2所示,在一个实施例中,提供了一种信息抽取方法。本实施例主要以该方法应用于上述图1中的终端110(或服务器120)来举例说明。参照图2,该信息抽取方法具体包括如下步骤:步骤S201,获取犯罪事实文本。步骤S202,提取犯罪事实文本的罪名要件对应的候选关键词。步骤S203,获取罪名要件对应的候选关键词的位置信息,根据候选关键词的位置信息重组候选关键词,得到重组语段。步骤S204,提取重组语段中罪名要件对应的目标关键词,目标关键词用于对犯罪事实文本对应的罪名进行预判。具体地,由于涉及的法律类型较多,为了更好的说明,本实施例以刑法为例。犯罪事实文本是指描述犯罪事实的文本信息,该信息可以是从网上下载的案例信息、犯罪行为人口述的语音信息识别的文字信息、图片信息上识别出的文字信息。罪名要件是指用于判定行为人是否犯罪的四大因素,罪名要件包括主体、客体、主观方面和客观方面,其中主体是具有承担刑事责任能力的人,客体是指犯罪行为侵害的是法律所保护的社会关系,主观方面是指行为人对其所实施的犯罪行为在主观上存在故意或过失的心理状态,客观方面说明行为的社会危害性,而为该行为成立犯罪所必须具备的客观事实特征。罪名要件对应的候选关键词是指用于描述罪名要件的属性信息,如主体为人时,属性信息可以包括人的称号、性别和年龄等用于描述人的词汇,可以为单位时,属性信息可以包括单位名称、单位成立时间和单位责任人等等用于描述单位的词汇。位置信息是指各个词汇在犯罪文本中的位置信息,该位置可以采用自定义的方式表示,如可以对犯罪事实文本进行编号,各个词汇所在的位置可以用编号表示。在提取了犯罪事实文本的罪名要件对应的候选关键词后,并获取到各个候选关键词的位置信息后,按照位置的前后顺序对各个候选关键词进行重组,形成重组语段。由于重组语本文档来自技高网...

【技术保护点】
1.一种信息抽取方法,其特征在于,所述方法包括:/n获取犯罪事实文本;/n提取所述犯罪事实文本的罪名要件对应的候选关键词;/n获取所述罪名要件对应的候选关键词的位置信息,根据所述候选关键词的位置信息重组所述候选关键词,得到重组语段;/n提取所述重组语段中所述罪名要件对应的目标关键词,所述目标关键词用于对所述犯罪事实文本对应的罪名进行预判。/n

【技术特征摘要】
1.一种信息抽取方法,其特征在于,所述方法包括:
获取犯罪事实文本;
提取所述犯罪事实文本的罪名要件对应的候选关键词;
获取所述罪名要件对应的候选关键词的位置信息,根据所述候选关键词的位置信息重组所述候选关键词,得到重组语段;
提取所述重组语段中所述罪名要件对应的目标关键词,所述目标关键词用于对所述犯罪事实文本对应的罪名进行预判。


2.根据权利要求1所述的方法,其特征在于,所述提取所述犯罪事实文本的罪名要件对应的候选关键词,包括:
将所述犯罪事实文本输入深度学习网络模型,通过所述深度学习网络模型对所述犯罪事实文本进行分词,得到多个分词结果;
对各个所述分词结果进行筛选,得到与所述罪名要件的对应的候选关键词。


3.根据权利要求1所述的方法,其特征在于,所述罪名要件包括主体、客体、主观方面和客观方面,所述提取所述犯罪事实文本的罪名要件对应的候选关键词,还包括:
获取与所述犯罪事实文本各个词汇对应的词性标注信息和对应的位置信息;
根据所述词性标注信息,筛选出所述词性标注信息为名词的第一词汇和对应的位置信息,将所述第一词汇作为所述客体对应的候选关键词;
根据所述词性标注信息,筛选出所述词性标注信息为动词的第二词汇和对应的位置信息,将所述第二词汇作为所述客观方面的候选关键词。


4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取过失词典;
根据所述过失词典对所述犯罪事实文本对应的词汇进行筛选,得到过失词汇,将所述过失词汇作为所述主观方面的候选关键词。


5.根据权利要求3所述的方法,其特征在于,所述重组语段包含多个子段落,所述提取所述重组语段中所述罪名要件对应的目标关键词,包括:
判断所述重组语段中各个子段落中是否存在词性标注为动词的候选关键词;
当所述子段落中存在动词时,将所述子段落中位于所述动词之前的称呼、人称代词或单位名称作为所述主体的目标关键词;
判断所述子段落...

【专利技术属性】
技术研发人员:李存林
申请(专利权)人:广州慧睿思通信息科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1