一种动态抽取信息的方法和系统、存储介质技术方案

技术编号:20025782 阅读:28 留言:0更新日期:2019-01-06 04:38
本发明专利技术实施例涉及一种动态抽取信息的方法和系统、存储介质,属于信息处理技术领域。该方法包括:对获取到的目标文本进行解析,得到目标文本对应的目标名称;从预设信息抽取规则中选取与目标名称相对应的目标信息抽取规则;根据目标信息抽取规则从目标文本中提取结构化信息。通过本实施例提供的:在对目标文本进行解析后,得到目标名称,根据目标名称从预设信息抽取规则中选取目标信息抽取规则,根据目标信息抽取规则从目标文本中提取结构化信息的技术方案,避免了现有技术中通过人工的方式对结构化信息进行抽取时,造成的出错率高,效率低等技术弊端,实现了高效且精准的对结构化信息进行抽取的技术效果。

【技术实现步骤摘要】
一种动态抽取信息的方法和系统、存储介质
本专利技术实施例涉及信息处理
,尤其涉及一种动态抽取信息的方法和系统、存储介质。
技术介绍
随着科学技术的发展,计算机的应用越发广泛。在现有技术中,对文本中的信息可以借助计算机进行处理。但是,计算机仅是作为某种工具,用于存储文本中的信息等。也就是说,在现有技术中,当需要对文本中的信息进行提取时,只能通过人工的方式进行提取,然后结合计算机,将人工提取出的信息在计算机上进行整合。因此,现有技术中存在由于人工对信息进行抽取,造成的出错率高,效率低等技术弊端。
技术实现思路
为解决上述技术问题,本专利技术实施例提供了一种动态抽取信息的方法和系统、存储介质。根据本专利技术实施例的一个方面,本专利技术实施例提供了一种动态抽取信息的方法,所述方法包括:对获取到的目标文本进行解析,得到所述目标文本对应的目标名称;从预设信息抽取规则中选取与所述目标名称相对应的目标信息抽取规则;根据所述目标信息抽取规则从所述目标文本中提取结构化信息。通过本实施例提供的:在对目标文本进行解析后,得到目标名称,根据目标名称从预设信息抽取规则中选取目标信息抽取规则,根据目标信息抽取规则从目标文本中提取结构化信息的技术方案,避免了现有技术中通过人工的方式对结构化信息进行抽取时,造成的出错率高,效率低等技术弊端,实现了高效且精准的对结构化信息进行抽取的技术效果。进一步地,所述方法还包括:对接收到的目标图形文件进行扫描,得到所述目标文本。通过本实施例提供的:对目标图像文件进行扫描,从而得到目标文件的技术方案,实现了通过简单快捷的方式得到目标文本的技术效果,从而实现了加速获取结构化信息的技术效果。进一步地,所述方法还包括:根据所述目标名称确定所述目标文本对应的目标文件类型;将所述目标文本保存至所述目标文件类型对应的目录。通过本实施例提供的:在根据目标名称确定目标文本对应的目标文件类型后,将目标文本保存至目标文件类型对应的目录的技术方案,实现了对目标文本的自动化归档,提高了文件整理效率,节约了时间和成本。进一步地,所述从预设信息抽取规则中选取与所述目标名称相对应的目标信息抽取规则,具体包括:根据所述目标名称确定所述目标文本对应的目标文件类型;根据所述目标文件类型从所述预设信息抽取规则中选取所述目标信息抽取规则。通过本实施例提供的:根据目标名称确定目标文件类型,以便根据目标文件类型选取目标信息抽取规则的技术方案,实现了快速确定目标信息抽取规则的技术效果,从而进一步实现了得到结构化信息的高效性和准确性的技术效果。进一步地,所述方法还包括:对采集到的每种文件类型均配置与其对应的信息抽取规则,得到所述预设信息抽取规则。通过本实施例提供的:通过采集多种文件类型,并对每种文件类型配置相应的信息抽取规则,得到多种信息抽取规则,即得到预设信息抽取规则的技术方案,实现了预设信息抽取规则的多样性的技术效果。根据本专利技术实施例的另一个方面,本专利技术实施例提供了一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如上所述的方法。根据本专利技术实施例的另一个方面,本专利技术实施例提供了一种动态抽取信息的系统,所述系统包括:解析模块、选取模块和提取模块,其中,所述解析模块用于:对获取到的目标文本进行解析,得到所述目标文本对应的目标名称;所述选取模块用于:从预设信息抽取规则中选取与所述目标名称相对应的目标信息抽取规则;所述提取模块用于:根据所述目标信息抽取规则从所述目标文本中提取结构化信息。通过本实施例提供的技术方案,避免了现有技术中通过人工的方式对结构化信息进行抽取时,造成的出错率高,效率低等技术弊端,实现了高效且精准的对结构化信息进行抽取的技术效果。进一步地,所述系统还包括:扫描模块,其中,所述扫描模块用于:对接收到的目标图形文件进行扫描,得到所述目标文本。通过本实施例提供的技术方案,实现了通过简单快捷的方式得到目标文本的技术效果,从而实现了加速获取结构化信息的技术效果。进一步地,所述系统还包括:确定模块和保存模块,其中,所述确定模块用于:根据所述目标名称确定所述目标文本对应的目标文件类型;所述保存模块用于:将所述目标文本保存至所述目标文件类型对应的目录。通过本实施例提供的技术方案,实现了对目标文本的自动化归档,提高了文件整理效率,节约了时间和成本。进一步地,所述系统还包括:配置模块,其中,所述配置模块用于:对采集到的每种文件类型均配置与其对应的信息抽取规则,得到所述预设信息抽取规则。通过本实施例提供的技术方案,实现了预设信息抽取规则的多样性的技术效果。进一步地,所述选取模块具体用于:根据所述目标名称确定所述目标文本对应的目标文件类型;根据所述目标文件类型从所述预设信息抽取规则中选取所述目标信息抽取规则。通过本实施例提供的技术方案,实现了快速确定目标信息抽取规则的技术效果,从而进一步实现了得到结构化信息的高效性和准确性的技术效果。附图说明图1为本专利技术实施例提供的一种动态抽取信息的方法的流程示意图;图2为本专利技术实施例提供的一种动态抽取信息的系统的结构示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本专利技术。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。本专利技术实施例提供了一种动态抽取信息的方法和系统、存储介质。根据本专利技术实施例的一个方面,本专利技术实施例提供了一种动态抽取信息的方法。第一实施例:请参阅图1,图1为本专利技术实施例提供的一种动态抽取信息的方法的流程示意图。如图1所示,该方法包括:S100:对获取到的目标文本进行解析,得到目标文本对应的目标名称。不同的文本对应的名称是不相同的。当某文本与另一文本的名称相同时,则称该两个文本为同一类型的文本。在获取到某文本(即目标文本A)后,对目标文本A进行解析,以便得到与目标文件A对应的目标名称a。具体地,可通过文字匹配、关键字匹配等方式确定目标文本对应的目标名称。如:对目标文本A进行解析后,确定目标文本A中包含“商标注册申请受理通知书”字样,则根据该字样确定该目标文本A对应的目标名称即为“商标注册申请受理通知书”。S200:从预设信息抽取规则中选取与目标名称相对应的目标信息抽取规则。不同的文本对应的名称不同,不同的名称对应的信息抽取规则也并不相同。如:当目标名称为“商标注册申请受理通知书”时,则其对应的目标信息抽取规则包括:申请日期抽取规则,申请号抽取规则等。S300:根据目标信息抽取规则从目标文本中提取结构化信息。当目标文本对应的目标名称为“商标注册申请受理通知书”时,则根据目标信息抽取规则从目标文本中提取结构化信息包括:申请日:2017年X月X日;申请号:22XXXX91;发文编号:TMZC22XXXXXXXXSL01;通知书名称:商标注册申请受理通知书;通知书内容:根据《商标法》和《商标法实施条例》有关规定,此商标的注册申请我局已受理。类别:第XX类。通过本实施例提供的:在对目标文本进行解析后,得到目标名称,根据目标名称从预设信息抽取规则中选取目标信息抽取规则,根据目标信息抽取规则从目标文本中提取结构化本文档来自技高网...

【技术保护点】
1.一种动态抽取信息的方法,其特征在于,所述方法包括:对获取到的目标文本进行解析,得到所述目标文本对应的目标名称;从预设信息抽取规则中选取与所述目标名称相对应的目标信息抽取规则;根据所述目标信息抽取规则从所述目标文本中提取结构化信息。

【技术特征摘要】
1.一种动态抽取信息的方法,其特征在于,所述方法包括:对获取到的目标文本进行解析,得到所述目标文本对应的目标名称;从预设信息抽取规则中选取与所述目标名称相对应的目标信息抽取规则;根据所述目标信息抽取规则从所述目标文本中提取结构化信息。2.根据权利要求1所述的一种动态抽取信息的方法,其特征在于,所述方法还包括:对接收到的目标图形文件进行扫描,得到所述目标文本。3.根据权利要求1所述的一种动态抽取信息的方法,其特征在于,所述方法还包括:根据所述目标名称确定所述目标文本对应的目标文件类型;将所述目标文本保存至所述目标文件类型对应的目录。4.根据权利要求1所述的一种动态抽取信息的方法,其特征在于,所述从预设信息抽取规则中选取与所述目标名称相对应的目标信息抽取规则,具体包括:根据所述目标名称确定所述目标文本对应的目标文件类型;根据所述目标文件类型从所述预设信息抽取规则中选取所述目标信息抽取规则。5.根据权利要求1-4中任一项所述的一种动态抽取信息的方法,其特征在于,所述方法还包括:对采集到的每种文件类型均配置与其对应的信息抽取规则,得到所述预设信息抽取规则。6.一种动态抽取信息的系统,其...

【专利技术属性】
技术研发人员:申奥戢运鑫王双徐建堂林赞磊商雷
申请(专利权)人:长城计算机软件与系统有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1