当前位置: 首页 > 专利查询>徐方林专利>正文

一种采用模板方式抽取结构化信息的系统技术方案

技术编号:9434594 阅读:131 留言:0更新日期:2013-12-12 00:38
本发明专利技术公开了一种采用模板方式抽取结构化信息的系统,它包括目标选定单元、模板配置单元、对象导入单元和信息抽取单元;所述目标选定单元采用智能选能模块,用于选定结构化信息的抽取对象;所述模板配置单元根据选定的结构化信息的抽取对象,配置相关的抽取模板;所述对象导入单元用于将抽取对象和抽取模板导入系统中;所述信息抽取单元根据抽取模板根据预先设置的信息,对抽取对象进行抽取操作,获得需要的结构化信息。本发明专利技术结构简单,设计巧妙,通过采用功能化的结构设计,克服了传统技术中的不足,填补了相关市场的空白,从而实现本发明专利技术的目的。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种采用模板方式抽取结构化信息的系统,它包括目标选定单元、模板配置单元、对象导入单元和信息抽取单元;所述目标选定单元采用智能选能模块,用于选定结构化信息的抽取对象;所述模板配置单元根据选定的结构化信息的抽取对象,配置相关的抽取模板;所述对象导入单元用于将抽取对象和抽取模板导入系统中;所述信息抽取单元根据抽取模板根据预先设置的信息,对抽取对象进行抽取操作,获得需要的结构化信息。本专利技术结构简单,设计巧妙,通过采用功能化的结构设计,克服了传统技术中的不足,填补了相关市场的空白,从而实现本专利技术的目的。【专利说明】一种采用模板方式抽取结构化信息的系统
本专利技术涉及信息处理软件领域,具体的说,特别涉及到一种采用模板方式抽取结 构化信息的系统。
技术介绍
互连网上出现的海量信息,大概分为结构化、半结构化和非结构化三种。结构化信 息如电子商务信息,信息的性质和量值的出现的位置是固定的;半结构化的信息如专业网 站上的细分频道,其标题和正文的语法相当规范,关键词的范围相当局限;非结构化的信息 如BLOG和BBS,所有内容都是不可预知的。结构化信息和非结构化信息是IT应用的两个世界,它们有着各自不同的应用进 化特点和规律。但是,这两个世界之间还缺少相互连接的桥梁,而这种缺失使企业中不可避 免地存在“活动”、“信息和知识”的分离,其后果就是:虽然它们都在进行着“知识化”的努 力,但两个世界分离的IT应用模式,注定使其难以真正实现它们的初衷——“在最合适的 时间,将最合适的信息传送给最合适的人。综上所述,针对现有技术的缺陷,特别需要一种采用模板方式抽取结构化信息的 系统,以解决以上提到的问题。
技术实现思路
本专利技术的目的在于提供一种采用模板方式抽取结构化信息的系统,通过采用功能 化的结构设计,克服了传统技术中的不足,从而实现本专利技术的目的。本专利技术所解决的技术问题可以采用以下技术方案来实现:一种采用模板方式抽取结构化信息的系统,它包括:目标选定单元,采用智能选能模块,用于选定结构化信息的抽取对象;模板配置单元,与所述的目标选定单元连接,根据选定的结构化信息的抽取对象,配置 相关的抽取模板;对象导入单元,分别与所述的目标选定单元和模板配置单元连接,用于将抽取对象和 抽取模板导入系统中;信息抽取单元,与所述的对象导入单元连接,根据抽取模板根据预先设置的信息,对抽 取对象进行抽取操作,获得需要的结构化信息。在本专利技术的一个实施例中,所述抽取模板抽取的结构化信息包括营运内容、部门 内容、Web内容和多媒体内容。在本专利技术的一个实施例中,所述结构化信息抽取完毕后,添加信息的大小、类别、 转换日期,便于后续处理。本专利技术的有益效果在于:结构简单,设计巧妙,通过采用功能化的结构设计,克服 了传统技术中的不足,填补了相关市场的空白,从而实现本专利技术的目的。【专利附图】【附图说明】图1为本专利技术所述的采用模板方式抽取结构化信息的方法的结构框图。【具体实施方式】为使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合 【具体实施方式】,进一步阐述本专利技术。如图1所示,本专利技术所述的一种采用模板方式抽取结构化信息的系统,它包括目 标选定单元100、模板配置单元200、对象导入单元300和信息抽取单元400。所述目标选定单元采用智能选能模块,用于选定结构化信息的抽取对象;所述模板配置单元与所述的目标选定单元连接,根据选定的结构化信息的抽取对象, 配置相关的抽取模板;所述对象导入单元分别与所述的目标选定单元和模板配置单元连接,用于将抽取对象 和抽取模板导入系统中;所述信息抽取单元与所述的对象导入单元连接,根据抽取模板根据预先设置的信息, 对抽取对象进行抽取操作,获得需要的结构化信息。在本专利技术的一个实施例中,为了增加所述方法的泛用性,所述抽取模板抽取的结 构化信息包括营运内容、部门内容、Web内容和多媒体内容。尤其需要指出的是,所述结构化信息抽取完毕后,添加信息的大小、类别、转换日 期,便于后续处理。本专利技术结构简单,设计巧妙,通过采用功能化的结构设计,克服了传统技术中的不 足,填补了相关市场的空白,从而实现本专利技术的目的。以上显示和描述了本专利技术的基本原理和主要特征和本专利技术的优点。本行业的技术 人员应该了解,本专利技术不受上述实施例的限制,上述实施例和说明书中描述的只是说明本 专利技术的原理,在不脱离本专利技术精神和范围的前提下,本专利技术还会有各种变化和改进,这些变 化和改进都落入要求保护的本专利技术范围内。本专利技术要求保护范围由所附的权利要求书及其 等效物界定。【权利要求】1.一种采用模板方式抽取结构化信息的系统,其特征在于,它包括:目标选定单元,采用智能选能模块,用于选定结构化信息的抽取对象;模板配置单元,与所述的目标选定单元连接,根据选定的结构化信息的抽取对象,配置 相关的抽取模板;对象导入单元,分别与所述的目标选定单元和模板配置单元连接,用于将抽取对象和 抽取模板导入系统中;信息抽取单元,与所述的对象导入单元连接,根据抽取模板根据预先设置的信息,对抽 取对象进行抽取操作,获得需要的结构化信息。2.根据权利要求1所述的一种采用模板方式抽取结构化信息的系统,其特征在于,所 述抽取模板抽取的结构化信息包括营运内容、部门内容、Web内容和多媒体内容。3.根据权利要求1所述的一种采用模板方式抽取结构化信息的系统,其特征在于,所 述结构化信息抽取完毕后,添加信息的大小、类别、转换日期,便于后续处理。【文档编号】G06F17/30GK103440267SQ201310332443【公开日】2013年12月11日 申请日期:2013年8月2日 优先权日:2013年8月2日 【专利技术者】徐方林 申请人:徐方林本文档来自技高网
...

【技术保护点】
一种采用模板方式抽取结构化信息的系统,其特征在于,它包括:目标选定单元,采用智能选能模块,用于选定结构化信息的抽取对象;模板配置单元,与所述的目标选定单元连接,根据选定的结构化信息的抽取对象,配置相关的抽取模板;对象导入单元,分别与所述的目标选定单元和模板配置单元连接,用于将抽取对象和抽取模板导入系统中;信息抽取单元,与所述的对象导入单元连接,根据抽取模板根据预先设置的信息,对抽取对象进行抽取操作,获得需要的结构化信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:徐方林
申请(专利权)人:徐方林
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1