基于页面变化的自动取证方法、装置、设备及存储介质制造方法及图纸

技术编号:38386038 阅读:20 留言:0更新日期:2023-08-05 17:41
本申请公开了一种基于页面变化的自动取证方法、装置、设备及存储介质,属于互联网取证技术领域。本申请通过接收待取证网页的网页地址和预设取证信息;在所述取证设备处于可操作状态时,对所述待取证网页进行访问;从所述待取证网页中识别出包括所述预设取证信息的页面,并进行截图,得到取证页面;将所述取证页面和取证时间进行打包,得到取证数据包,无需执法人员主动访问待取证网页,在发现侵权信息时,无需主动截图取证,实现了自动取证。实现了自动取证。实现了自动取证。

【技术实现步骤摘要】
基于页面变化的自动取证方法、装置、设备及存储介质


[0001]本申请涉及互联网取证
,尤其涉及一种基于页面变化的自动取证方法、装置、设备及存储介质。

技术介绍

[0002]互联网取证是指针对性的对互联网上的侵权行为进行证据合法获取、证据云端留存,这种取证操作过程称之为互联网取证。现有的互联网侵权行为一般表现为在网页中使用未经授权的图片,或在网页中引用他人文字信息未标明出处。目前针对上述互联网侵权行为的取证方法需要执法人员登录取证设备,主动访问待取证网页,在发现侵权信息时,执法人员控制取证设备动作截图来实现取证,无法自动取证。
[0003]上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。

技术实现思路

[0004]本申请的主要目的在于提供一种基于页面变化的自动取证方法、装置、设备及存储介质,旨在解决现有互联网取证方法无法自动取证的技术问题。
[0005]为实现上述目的,本申请提供一种基于页面变化的自动取证方法,应用于取证设备,包括以下步骤:
[0006]接收待取证网页的网页地址和预设取证信息;
[0007]在所述取证设备处于可操作状态时,对所述待取证网页进行访问;
[0008]从所述待取证网页中识别出包括所述预设取证信息的页面,并进行截图,得到取证页面;
[0009]将所述取证页面和取证时间进行打包,得到取证数据包。
[0010]可选地,所述从所述待取证网页中识别出包括所述预设取证信息的页面,并进行截图,得到取证页面的步骤包括:
[0011]对所述待取证网页的当前展示页面进行所述预设取证信息识别;
[0012]当识别到所述预设取证信息时,进行截图,得到取证页面;
[0013]当未识别到所述预设取证信息时,判断是否完成对所述待取证网页的所述预设取证信息识别;
[0014]若否,则控制所述待取证网页滑动,得到新的当前展示页面,并返回对所述待取证网页的当前展示页面进行所述预设取证信息识别的步骤;
[0015]若是,则结束取证。
[0016]可选地,所述预设取证信息为图片信息,所述对所述待取证网页的当前展示页面进行所述预设取证信息识别的步骤,包括:
[0017]获取所述当前展示页面中的所有图片,并进行预处理;
[0018]分别获取预处理后的图片与预设取证信息的色值图,计算色值图相似度;
[0019]提取预处理后的图片与预设取证信息中的特征图像,计算特征图像相似度;
[0020]当所述色值图相似度满足第一预设条件,且所述特征图像相似度满足第二预设条件,则判定当前展示页面中存在所述预设取证信息。
[0021]可选地,所述获取预处理后的图片与预设取证信息的色值图,计算色值图相似度的步骤,包括:
[0022]获取预处理后的图片与预设取证信息的色值图;
[0023]从所述预处理后的图片与预设取证信息的色值图中,提取所述预处理后的图片与预设取证信息中的色值数据,并对其进行归一化处理,其中,所述预处理后的图片中的色值数据与所述预设取证信息中的色值数据一一对应;
[0024]基于归一化处理后的每一组对应的色值数据,计算得到色值图相似度。
[0025]可选地,所述提取预处理后的图片与预设取证信息中的特征图像,计算特征图像相似度的步骤,包括:
[0026]对预处理后的图片与预设取证信息进行网格划分并编码,其中,预处理后的图片划分的网格数量与预设取证信息划分的网格数量相同;
[0027]分别获取预处理后的图片与预设取证信息中符合第三预设条件的网格,由符合第三预设条件的网格组成特征图像;
[0028]基于网格编码,将预处理后的图片中的特征图像的网格与预设取证信息中的特征图像的网格一一对应;
[0029]计算预处理后的图片中的特征图像与预设取证信息中的特征图像的网格对应率;
[0030]计算预处理后的图片中的特征图像与预设取证信息中的特征图像各对应网格间的灰度偏差值;
[0031]基于所述网格对应率和灰度偏差值,计算得到特征图像相似度。
[0032]可选地,所述预设取证信息为文本信息,所述对所述待取证网页的当前展示页面进行所述预设取证信息识别的步骤,包括:
[0033]对所述当前展示页面中的文本信息进行识别,得到文本数组;
[0034]判断所述预设取证信息是否存在于所述文本数组中;
[0035]若存在,则判定当前展示页面中存在所述预设取证信息。
[0036]可选地,所述控制所述待取证页面滑动,得到新的当前展示页面的步骤,包括:
[0037]控制所述待取证页面以预设速度匀速滑动;
[0038]当滑动时间满足预设时间后,控制所述待取证页面停止滑动,得到新的当前展示页面。
[0039]可选地,所述控制所述待取证页面滑动,得到新的当前展示页面的步骤,包括:
[0040]控制所述待取证页面滑动;
[0041]计算当前展示页面与前一展示页面的相似度,其中,所述前一展示页面为最新的且已进行所述预设取证信息识别的展示页面;
[0042]若所述相似度满足第四预设条件,则将当前展示页面作为新的当前展示页面;
[0043]若所述相似度未满足第四预设条件,则返回控制所述待取证页面滑动的步骤,直至所述相似度满足第四预设条件。
[0044]可选地,所述计算当前展示页面与前一展示页面的相似度的步骤,包括:
[0045]计算当前展示页面与前一展示页面的哈希值的汉明距离;
[0046]当所述汉明距离小于预设阈值,则得到当前展示页面与前一展示页面的相似度为1;
[0047]当所述汉明距离大于或等于预设阈值,则得到当前展示页面与前一展示页面的相似度为0。
[0048]可选地,所述在所述取证设备处于可操作状态时,对所述待取证网页进行访问的步骤之后,包括:
[0049]在成功访问所述待取证网页后,将所述取证设备更新为不可操作状态。
[0050]可选地,所述将所述取证页面和取证时间进行打包,得到取证数据包的步骤之后,还包括:
[0051]对所述取证数据包进行非对称加密,将加密后的取证数据包上传至存证服务器中进行存储。
[0052]此外,为实现上述目的,本申请还提供一种基于页面变化的自动取证装置,包括:
[0053]数据接收模块,用于接收待取证网页的网页地址和预设取证信息;
[0054]访问建立模块,用于在所述取证设备处于可操作状态时,对所述待取证网页进行访问;
[0055]取证模块,用于从所述待取证网页中识别出包括所述预设取证信息的页面,并进行截图,得到取证页面;
[0056]数据打包模块,用于将所述取证页面和取证时间进行打包,得到取证数据包。
[0057]可选地,所述取证模块包括:
[0058]第一识别单元,用于对所述待取证网页的当前展示页面进行所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于页面变化的自动取证方法,其特征在于,应用于取证设备,所述基于页面变化的自动取证方法,包括以下步骤:接收待取证网页的网页地址和预设取证信息;在所述取证设备处于可操作状态时,对所述待取证网页进行访问;从所述待取证网页中识别出包括所述预设取证信息的页面,并进行截图,得到取证页面;将所述取证页面和取证时间进行打包,得到取证数据包。2.如权利要求1所述的基于页面变化的自动取证方法,其特征在于,所述从所述待取证网页中识别出包括所述预设取证信息的页面,并进行截图,得到取证页面的步骤包括:对所述待取证网页的当前展示页面进行所述预设取证信息识别;当识别到所述预设取证信息时,进行截图,得到取证页面;当未识别到所述预设取证信息时,判断是否完成对所述待取证网页的所述预设取证信息识别;若否,则控制所述待取证网页滑动,得到新的当前展示页面,并返回对所述待取证网页的当前展示页面进行所述预设取证信息识别的步骤;若是,则结束取证。3.如权利要求2所述的基于页面变化的自动取证方法,其特征在于,所述预设取证信息为图片信息,所述对所述待取证网页的当前展示页面进行所述预设取证信息识别的步骤,包括:获取所述当前展示页面中的所有图片,并进行预处理;分别获取预处理后的图片与预设取证信息的色值图,计算色值图相似度;提取预处理后的图片与预设取证信息中的特征图像,计算特征图像相似度;当所述色值图相似度满足第一预设条件,且所述特征图像相似度满足第二预设条件,则判定当前展示页面中存在所述预设取证信息。4.如权利要求3所述的基于页面变化的自动取证方法,其特征在于,所述获取预处理后的图片与预设取证信息的色值图,计算色值图相似度的步骤,包括:获取预处理后的图片与预设取证信息的色值图;从所述预处理后的图片与预设取证信息的色值图中,提取所述预处理后的图片与预设取证信息中的色值数据,并对其进行归一化处理,其中,所述预处理后的图片中的色值数据与所述预设取证信息中的色值数据一一对应;基于归一化处理后的每一组对应的色值数据,计算得到色值图相似度。5.如权利要求3所述的基于页面变化的自动取证方法,其特征在于,所述提取预处理后的图片与预设取证信息中的特征图像,计算特征图像相似度的步骤,包括:对预处理后的图片与预设取证信息进行网格划分并编码,其中,预处理后的图片划分的网格数量与预设取证信息划分的网格数量...

【专利技术属性】
技术研发人员:李括
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1