一种word转数据库字段的通用方法技术

技术编号:41128390 阅读:19 留言:0更新日期:2024-04-30 17:56
本发明专利技术公开了一种WORD转数据库字段的通用方法,包括如下步骤:步骤一,使用Aspose技术将WORD格式的文件转为HTML格式;步骤二,识别步骤一转为的HTML格式文件所标记的标题和内容,并对标题做层级区分;步骤三,基于步骤二所区分的层级解析文件得到以下字段:序号、目录层级、内容带标签、内容不带标签;步骤四,从上倒下循环将步骤三分析得到的字段再次解析分类,按文档的写作格式分类;步骤五,基于步骤四解析分类的内容建立存储数据库字段模板库;步骤六,根据步骤五建立的模板库解析WORD内容并存入数据库。本发明专利技术的WORD转数据库字段的通用方法,通过步骤一至步骤六的设置,便可有效的实现转换WORD格式的文件解析后存入数据库内。

【技术实现步骤摘要】

本专利技术涉及一种数据处理领域,更具体的说是涉及一种word转数据库字段的通用方法


技术介绍

1、目前全球企业系统越来越大,数据的总容量大约是每三年就要翻两番,这种情况下,数据存放可能分布越广,可能会出现同一个系统的数据被放到了不同的数据库中,或者由于要做系统升级换不同的数据库,要做不同数据库之间的数据移植,这时对于应用系统不同的数据库的访问的方法和方式完全不一样,造成了大量的升级工作量和工时。现有大多数系统和数据库应用绑定太紧密,造成系统上许多的不便利。

2、而目前的数据处理软件使用的较多为word软件进行文字数据处理,然而由于word软件所处理的文件数据格式与数据库的文件数据格式不同,而在需要将经过word软件所处理的文件数据输入到数据库内时候,就只能够通过人工输入的方式,如此大大的增加了数据的存放成本。


技术实现思路

1、针对现有技术存在的不足,本专利技术的目的在于提供一种将word转数据库字段的通用方法,便可有效的实现方便word软件所处理的文件数据转换存储至数据库内了。

2本文档来自技高网...

【技术保护点】

1.一种WORD转数据库字段的通用方法,其特征在于:包括如下步骤:

2.根据权利要求1所述的WORD转数据库字段的通用方法,其特征在于:所述步骤二中的做层级区分的后的内容标签包括<h>、<p>、<img>、<table>,具体分为:

3.根据权利要求2所述的WORD转数据库字段的通用方法,其特征在于:所述步骤四中按文档的写作格式分类的具体步骤如下:

4.根据权利要求3所述的WORD转数据库字段的通用方法,其特征在于:所述步骤四中从上倒下循环将步骤三分析得到的字段再次解析分类的具体步骤如下:在识别到“标题层...

【技术特征摘要】

1.一种word转数据库字段的通用方法,其特征在于:包括如下步骤:

2.根据权利要求1所述的word转数据库字段的通用方法,其特征在于:所述步骤二中的做层级区分的后的内容标签包括<h>、<p>、<img>、<table>,具体分为:

3.根据权利要求2所述的word转数据库字段的通用方法,其特征在于:所述步骤四中按文档的写作格式分类的具体步骤如下:

4.根据权利要求3所述的word转数据库字段的通用方法,其特征在于:所述步骤...

【专利技术属性】
技术研发人员:林斌傅潇杭徐高清陈良辅陈启钰丁凯钱小虎董跃徐亦萍
申请(专利权)人:浙江金汇数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1