一种RTF文件的解析方法及装置制造方法及图纸

技术编号:21343944 阅读:26 留言:0更新日期:2019-06-13 22:38
本发明专利技术实施例提供了一种RTF文件的解析方法及装置,涉及数据处理技术领域,该方法包括:在对RTF文件进行病毒查杀时,先对RTF文件进行降维处理,生成目标文件,再将预设头部标识与目标文件中的字符进行匹配,在确定目标文件中包含与预设头部标识匹配的字符时,从目标文件中确定出预设头部标识对应的域操作符,最后将预设头部标识对应的域操作符内的字符确定为目标子文件,由于先对RTF文件进行降维处理,简化了RTF文件的内容,故在检测RTF文件中的目标子文件时,避免了无效字符的干扰,从而降低了检测难度,同时提高了检测准确性。通过对目标子文件进行逻辑检测,确定目标子文件是否为恶意文件,提高对病毒和攻击的防御能力。

A Method and Device for Resolving RTF Files

The embodiment of the present invention provides a method and a device for parsing RTF files, which relates to the technical field of data processing. The method includes: first, dimension reduction of RTF files is carried out to generate target files, then the preset header identification is matched with the characters in the target files, and then the characters matched with the preset header identification are included in the determined target files. At the same time, the domain operator corresponding to the preset header identifier is determined from the target file. Finally, the characters in the domain operator corresponding to the preset header identifier are determined as the target subfile. Because the dimensionality reduction of the RTF file first simplifies the content of the RTF file, the interference of invalid characters is avoided in the detection of the target subfile in the RTF file, which reduces the detection difficulty. The accuracy of detection is improved. Through logical detection of target subfiles, we can determine whether the target subfiles are malicious files, and improve the defense against viruses and attacks.

【技术实现步骤摘要】
一种RTF文件的解析方法及装置
本专利技术实施例涉及数据处理
,尤其涉及一种RTF文件的解析方法及装置。
技术介绍
目前流行的攻击技术通常会包含一个高度混淆的多信息文本格式(RichTextFormat,简称RTF)文件,该类高度混淆的RTF文件的内容杂乱无章,没有任何规律。当这些RTF中嵌入了恶意的对象连接与嵌入(ObjectLinkingandEmbedding,简称OLE)文件、压缩(zip)文件或者vbe文件等子文件时,因文件高度混淆,反病毒引擎往往很难正确的检测出该类RTF文件中嵌入的子文件,因此也无法进一步检测嵌入的子文件是否为恶意子文件。恶意子文件在正常设备上运行时,将扰乱正常设备的操作,给正常设备的安全带来威胁。
技术实现思路
由于在高度混淆的RTF文件中,反病毒引擎往往很难正确的检测到RTF文件中嵌入的子文件,因此也无法进一步检测嵌入的子文件是否为恶意子文件,导致恶意子文件扰乱正常设备的操作,给正常设备的安全带来威胁的问题,本专利技术实施例提供了一种RTF文件的解析方法及装置。一方面,本专利技术实施例提供了一种RTF文件的解析方法,该方法包括:获取待解析RTF文件本文档来自技高网...

【技术保护点】
1.一种RTF文件的解析方法,其特征在于,包括:获取待解析RTF文件;对所述待解析RTF文件进行降维处理,生成目标文件;将预设头部标识与所述目标文件中的字符进行匹配;在确定所述目标文件中包含与所述预设头部标识匹配的字符时,从所述目标文件中确定出所述预设头部标识对应的域操作符;将所述预设头部标识对应的域操作符内的字符确定为目标子文件。

【技术特征摘要】
1.一种RTF文件的解析方法,其特征在于,包括:获取待解析RTF文件;对所述待解析RTF文件进行降维处理,生成目标文件;将预设头部标识与所述目标文件中的字符进行匹配;在确定所述目标文件中包含与所述预设头部标识匹配的字符时,从所述目标文件中确定出所述预设头部标识对应的域操作符;将所述预设头部标识对应的域操作符内的字符确定为目标子文件。2.如权利要求1所述的方法,其特征在于,所述对所述待解析RTF文件进行降维处理,生成目标文件,包括:确定RTF文件对应的有效标签集合;将所述待解析RTF文件中的字符与所述RTF文件对应的有效标签集合进行比对,确定所述待解析RTF文件中的有效标签;去除所述待解析RTF文件中的有效标签;将预设字符与去除所述有效标签的待解析RTF文件进行比对,确定所述待解析RTF文件中的有效字符;过滤所述去除所述有效标签的待解析RTF文件中除所述有效字符之外的字符,生成目标文件。3.如权利要求1所述的方法,其特征在于,还包括:将所述目标文件转化为二进制格式的文件。4.如权利要求1、2或3所述的方法,其特征在于,所述将所述预设头部标识对应的域操作符内的字符确定为目标子文件之后,还包括:对所述目标子文件进行逻辑检测;在确定所述目标子文件满足预设逻辑时,将所述目标子文件确定为正常文件,否则,将所述目标子文件确定为恶意文件。5.如权利要求4所述的方法,其特征在于,所述获取待解析RTF文件,包括:识别待解析文件的文件类型;在确定所述待解析文件的文件类型为RTF文件时,获取...

【专利技术属性】
技术研发人员:姜澎于涛郭晓龙屈亚鑫张友旭任光辉毕磊申金娟吴彬苏蒙崔精兵郭长宇赵子云王玥
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1