一种基于嵌入元语言指令的文本处理方法及装置制造方法及图纸

技术编号:8105805 阅读:216 留言:0更新日期:2012-12-21 04:41
本发明专利技术公开了一种基于嵌入元语言指令的文本处理方法及装置,其包括:用户对原始文本文件键入元语言指令,生成嵌入了元语言指令的文本文件;过滤引擎对嵌入了元语言指令的文本文件进行处理,识别嵌入的元语言指令,根据元语言指令选择性过滤和加解密文本内容并输出;生成目标文件。本发明专利技术能够节省文件存储空间,降低人力维护成本,同时保护文件内容的安全。

【技术实现步骤摘要】

本专利技术涉及电子数字数据处理
,特别是涉及一种基于嵌入元语言指令的文本处理方法及装置
技术介绍
电子数字文本文件用于记录、传递和表达文字内容,已经广泛应用于计算机应用各个领域。在实际应用过程中,人们经常需要针对不同对象基于相同原始文本文件发布内容不同甚至是部分加密的最终发布文本。然而对于这种需求,鲜有有效的方法可以使用。通常只能通过手工编辑的方式来完成。上述手工编辑的方法易于出错,需要保存大量基于相同原始文本而又内容不同的发布文本文件浪费存储空间,日后还要针对每个不同的发布文本文件进行维护浪费人力。
技术实现思路
本专利技术的一个目标是提供一种方法及装置,用于在计算机可读文本文件中嵌入元语言指令并且可以方便的对特定内容进行过滤和加解密生成所需的文本内容,用以保护文本内容,减少维护成本和节省存储空间。本专利技术提供了一种基于嵌入元语言指令的文本处理方法,其包括以下步骤步骤(a)用户对原始文本文件键入元语言指令,生成嵌入了元语言指令的文本文件;步骤(b)过滤引擎对嵌入了元语言指令的文本文件进行处理,识别嵌入的元语言指令,根据元语言指令选择性过滤和加解密文本内容并输出;步骤(c )生成目标文件。进一步,该元语言指令包括用于定义预设的条件的条件定义指令、用于清除预设的条件的条件清除指令、用于过滤选取文本的条件判断指令及结束指令、用于选择性加密选定文本内容的加密指令、加密结束指令、用于选择性解密选定文本内容的解密指令以及解密结束指令。其中,步骤(b)进一步包括步骤(I)过滤引擎使用传入条件初始化自身及过滤条件库;步骤(2)过滤引擎判断输入文件是否结束,如果结束进入步骤(29)过滤引擎进行退出处理释放资源;如果尚未结束,进入步骤(3);步骤(3 )从输入文件读取一个单字;步骤(4)判断当前读入单字是否为元语言指令字前缀,如果是元语言指令字前缀则转入步骤5,否则转入步骤(22);步骤(5)判断当前指令是否为元语言条件定义指令,如果是元语言条件定义指令则进入步骤(6);步骤(6)读取待定义的条件和可选的值,过滤引擎定义该条件并存入条件库中;下一步转步骤(2);如果步骤(5)判断不是元语言条件定义指令则转入步骤(7);步骤(7)判断当前指令是否为元语言条件清除指令,如果是元语言条件清除指令则进入步骤(8);如果判断不是元语言条件清除指令则转入步骤(9);步骤(8)读取待清除的条件,如果在条件库中找到该条件,过滤引擎从条件库中删除该条件,下一步转步骤(2);步骤(9)判断当前指令是否为元语言条件判断指令,如果是元语言条件判断指令则进入步骤(10);如果判断不是元语言条件判断指令则转入步骤(12);步骤(10)读取待判断的条件,并在条件库中搜索该条件和对应的值,进入步骤(11); 步骤(11)如果在条件库中找到该条件且条件值匹配,过滤引擎根据当前环境生成新的条件环境并压入环境栈,否则直接生成滤出条件环境并压入环境栈,下一步转步骤(2);步骤(12)判断当前指令是否为元语言条件判断结束指令,如果是元语言条件判断结束指令则进入步骤(13),如果判断不是元语言条件判断结束指令则转入步骤(14);步骤(13)过滤引擎将当前条件环境栈出栈,下一步转步骤(2);步骤(14)判断当前指令是否为元语言加密指令,如果是元语言加密指令则步骤(15),如果判断不是元语言加密指令则转入步骤(16);步骤(15)过滤引擎进入加密状态,下一步转步骤(2);步骤(16)判断当前指令是否为元语言加密结束指令,如果是元语言加密结束指令则进入步骤(17);如果判断不是元语言加密结束指令则转入步骤(18);步骤(17)过滤引擎退出加密状态,下一步转步骤(2);步骤(18)判断当前指令是否为元语言解密指令,如果是元语言解密指令则进入步骤(19);如果判断不是元语言解密指令则转入步骤(20);步骤(19)过滤引擎进入解密状态,下一步转步骤(2);步骤(20)判断当前指令是否为元语言解密结束指令,如果是元语言解密结束指令则进入步骤(21),如果判断不是元语言解密结束指令则转入步骤(22 );步骤(21)过滤引擎退出解密状态,下一步转步骤(2)。其中,步骤(b)进一步包括步骤(22)从输入文件当前位置读取一个字符串;步骤(23)判断当前的环境是否允许输出,如果允许输出,则进入步骤(24);步骤(24)判断是否进入加密状态,如果进入加密状态,进入步骤(25);如果未进入加密状态则进入步骤(26);步骤(25)加密该字符串并写入输出文件;步骤(26)判断是否进入解密状态,如果进入解密状态,进入步骤(27);否则进入步骤(28);步骤(27)解密该字符串并写入输出文件;步骤(28)直接将该字符串写入输出文件,下一步转步骤(2)。进一步,步骤(5)包括 如果条件库中如有同名条件,则用新条件值覆盖丨H条件值。进一步,步骤(a)所述嵌入是用户以字符串的形式嵌入元语言指令,过滤引擎识别该字符串。本专利技术还提供了一种基于嵌入元语言指令的文本处理装置,其包括以下单元键入单元,用户对原始文本文件键入元语言指令,生成嵌入了元语言指令的文本文件;处理单元,过滤引擎对嵌入了元语言指令的文本文件进行处理,识别嵌入的元语言指令,根据元语言指令选择性过滤和加解密文本内容并输出;生成单元,生成目标文件。进一步,该元语言指令包括用于定义预设的条件的条件定义指令、用于清除预设的条件的条件清除指令、用于过滤选取文本的条件判断指令及结束指令、用于选择性加密选定文本内容的加密指令、加密结束指令、用于选择性解密选定文本内容的解密指令以及解密结束指令。进一步,所述键入单元是用户以字符串的形式嵌入元语言指令,过滤引擎识别该 字符串。本专利技术提供的在文本中嵌入元语言指令的方法,对于存储、维护内容相关度较高的文本的需求,提供了一种优化方案。本专利技术提供的过滤方法可以针对不同预设条件及其组合有效过滤嵌入本专利技术提供的元语言指令的文本。整个方案能够节省文件存储空间,降低人力维护成本,同时保护文件内容的安全。附图说明图I是示出根据本专利技术的用户键入元语言指令的流程图;图2是根据本专利技术的方法的整体流程图;图3-1至图3-10是根据本专利技术的过滤引擎具体进行过滤的流程图。具体实施例方式为使本专利技术的上述目的、特征和优点更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明在本专利技术的方法中,首先需要将元语言指令嵌入原始文本文件,如图I所示,具体包括步骤(I):提取原始文本文件12 ;步骤(2)用户进行编辑,键入元语言指令II,该指令包括用于定义预设的条件的条件定义指令、用于清除预设的条件的条件清除指令、用于过滤选取文本的条件判断指令及结束指令、用于选择性加密选定文本内容的加密指令、加密结束指令、用于选择性解密选定文本内容的解密指令以及解密结束指令;步骤(3)用于将用户键入的元语言指令嵌入到原始文本文件中生成嵌入了元语言指令的文本文件13。图2表示根据本专利技术的方法的整体流程图,即过滤引擎处理嵌入元语言指令的文本文件并生成目标文件的过程。如IIl所示用户启动过滤引擎并传入必要参数,如待过滤文本文件路径和目标文件路径,过滤条件,密钥等信息。如112所示过滤引擎读入嵌入了元语言指令的文本文件113,对该文件进行分析,识别嵌入的元语本文档来自技高网...

【技术保护点】
一种基于嵌入元语言指令的文本处理方法,其特征在于包括以下步骤:步骤(a)用户对原始文本文件键入元语言指令,生成嵌入了元语言指令的文本文件;步骤(b)过滤引擎对嵌入了元语言指令的文本文件进行处理,识别嵌入的元语言指令,根据元语言指令选择性过滤和加解密文本内容并输出;步骤(c)生成目标文件。

【技术特征摘要】

【专利技术属性】
技术研发人员:张扬
申请(专利权)人:芯原微电子北京有限公司芯原微电子上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1