一种种子下载的IP溯源方法技术

技术编号:34293162 阅读:26 留言:0更新日期:2022-07-27 09:59
本发明专利技术属于互联网技术领域,具体涉及一种种子下载的IP溯源方法,该方法包括:采集下载的初始种子的属性数据;对初始种子的属性数据进行预处理,得到中间种子;利用预设的权重分析模型对中间种子进行权重分析,得到分析结果;根据分析结果确定种子下载的IP溯源,并将种子下载的IP溯源进行可视化展示。本申请提供的技术方案,不仅提高了溯源的可靠性和准确性,实现对种子的散布者的准确溯源,还有助于人员筛查和落地。人员筛查和落地。人员筛查和落地。

【技术实现步骤摘要】
一种种子下载的IP溯源方法


[0001]本专利技术属于互联网
,具体涉及一种种子下载的IP溯源方法。

技术介绍

[0002]种子下载就是现在流行的BT下载。上传到服务器上的torrent文件就是种子。它包含了下载的文件的引导信息。BT是一种类似于电驴的P2P共享软件,全名叫“BitTorrent”,中文全称是“比特流”,是一种新的类似于P2P共享软件,因为每个下载的人同时又可以上传,下载的人越多,文件越大,速度就越快,而且只要普通的电脑,一根ADSL电话线就可以安装BT服务器。
[0003]因为每个下载种子的人同时又可以上传种子,每个源头收到种子信息的时间和执行下载的时间也不一样,所以散布种子的源头可能不止一个人。每个种子,都有对应的唯一哈希值,通过对种子的哈希值进行长时间的监测,得到下载种子的IP数据库。但要想知道这些种子是从哪儿流传出来就必须对种子的溯源进行追踪。
[0004]目前只能通过单纯的从下载种子的探测时间这一项要素分析,即认为时间最早的,就认定为种子散布的源头,但此种方法可靠性低。因为种子下载技术,每个下载的人同时又可以上传,当几个人下载的时间比较接近时,还依然取第一探测时间的对象,很容易忽略与之时间接近的对象,使之成为漏网之鱼。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于克服现有技术的不足,提供一种种子下载的IP溯源方法,以解决现有技术中认为下载种子的时间最早的IP为种子散布的源头存在可靠性低的问题。
[0006]根据本申请实施例的第一方面,提供一种种子下载的IP溯源方法,所述方法包括:采集下载的初始种子的属性数据;对所述初始种子的属性数据进行预处理,得到中间种子;利用预设的权重分析模型对所述中间种子进行权重分析,得到分析结果;根据所述分析结果确定种子下载的IP溯源,并将所述种子下载的IP溯源进行可视化展示。
[0007]优选的,所述初始种子的属性数据,包括:IP地址、端口号、种子名称、哈希值、探测时间、探测状态、下载次数和邮编。
[0008]优选的,所述对所述初始种子的属性数据进行预处理,得到中间种子,包括:对所述初始种子的属性数据进行数据清洗,以对属性数据中的脏数据进行清洗,并删除属性数据中存在脏数据的初始种子,得到中间种子;利用IP定位技术,对所述中间种子进行IP定位,得到所述中间种子的经纬度和地理位置,并将所述中间种子的经纬度和地理位置添加至所述中间种子的属性数据;其中,所述中间种子的属性数据,包括:IP地址、端口号、种子名称、哈希值、经纬
度、地理位置、探测时间、探测状态、下载次数和邮编。
[0009]优选的,所述利用预设的权重分析模型对所述中间种子进行权重分析,得到分析结果,包括:步骤a:令所述中间种子的探测状态为第一维度,所述中间种子的探测时间为第二维度,所述中间种子的下载次数为第三维度,与所述中间种子的IP地址相同的其他中间种子的下载次数分为第四维度;为所述第一维度、所述第二维度、所述第三维度和所述第四维度分配不同的权重,其中,所述第一维度的权重为第一权重,所述第二维度的权重为第二权重,所述第三维度的权重为第三权重,所述第四维度的权重为第四权重;步骤b:根据所述第一权重、所述第二权重、所述第三权重和所述第四权重,分别获取所述第一维度的目标分数、所述第二维度的目标分数、所述第三维度的目标分数和所述第四维度的目标分数;步骤c:根据所述第一维度的目标分数获取所述第一维度的实际分数;步骤d:根据所述第二维度的目标分数获取所述第二维度的实际分数;步骤e:根据所述第三维度的目标分数获取所述第三维度的实际分数;步骤f:根据所述第四维度的目标分数获取所述第四维度的实际分数;步骤g:所述中间种子的最终分数为所述第一维度的实际分数、所述第二维度的实际分数、所述第三维度的实际分数和所述第四维度的实际分数的总和,所述中间种子的最终分数为所述分析结果。
[0010]优选的,所述步骤b,包括:按下式确定所述第一维度的目标分数L1:L1=f*W1按下式确定所述第二维度的目标分数L2:L2=f*W2按下式确定所述第三维度的目标分数L3:L3=f*W3按下式确定所述第四维度的目标分数L4:L4=f*W4上式中,f为所述中间种子的目标分数,W1为所述第一权重,W2为所述第二权重,W3为所述第三权重,W4为所述第四权重。
[0011]优选的,所述步骤c,包括:若所述中间种子的探测状态为SSL

HS、HS

Utp或PS,则按下式确定所述第一维度的实际分数F1:F1=L1*a1若所述中间种子的探测状态为SSL或PA,则按下式确定所述第一维度的实际分数F1:F1=L1*a2若所述中间种子的探测状态为P,则按下式确定所述第一维度的实际分数F1:F1=L1*a3
上式中,L1为所述第一维度的目标分数,a1为预设的探测状态SSL

HS、HS

uTP和PS的权重,a2为预设的探测状态SSL和PA的权重,a3为预设的探测状态P的权重。
[0012]优选的,所述步骤d,包括:对所有的所述中间种子的探测时间进行升序排序;基于预设的分配权重的第一规则,根据所述中间种子的探测时间的排名,确定所述中间种子的探测时间的权重;按下式确定所述第二维度的实际分数F2:F2=L2*b上式中,L2为所述第二维度的目标分数,b为所述中间种子的探测时间的权重。
[0013]优选的,所述步骤e,包括:对所有的所述中间种子的下载次数进行降序排序;基于预设的分配权重的第二规则,根据所述中间种子的下载次数的排名,确定所述中间种子的下载次数的权重;按下式确定所述第三维度的实际分数F3:F3=L3*c上式中,L3为所述第三维度的目标分数,c为所述中间种子的下载次数的权重。
[0014]优选的,所述步骤f,包括:对所述与所述中间种子的IP地址相同的其他中间种子的下载次数进行降序排序;基于预设的分配权重的第三规则,根据所述与所述中间种子的IP地址相同的其他中间种子的下载次数的排名,确定所述与所述中间种子的IP地址相同的其他中间种子的下载次数的权重;按下式确定所述第四维度的实际分数F4:F4=L4*d上式中,L4为所述第四维度的目标分数,d为所述与所述中间种子的IP地址相同的其他中间种子的下载次数的权重。
[0015]优选的,所述根据所述分析结果确定种子下载的IP溯源,包括:当所述中间种子的最终分数F大于等于预设阈值时,所述中间种子的IP地址为种子下载的IP溯源;将所述种子下载的IP溯源对应的中间种子的最终分数、IP地址、种子名称、哈希值、经纬度和地理位置,进行可视化展示。
[0016]本专利技术采用以上技术方案,能够达到的有益效果包括:通过采集下载的初始种子的属性数据,对初始种子的属性数据进行预处理,得到中间种子,以排除掉无效的种子,从而提高了溯源的准确性;通过利用预设的权重分析模型对中间种子进行权重分析,得到分析结果,根据分析结果确定种子下载的IP溯源,并将种子下载的IP溯源进行可视化展示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种种子下载的IP溯源方法,其特征在于,所述方法包括:采集下载的初始种子的属性数据;对所述初始种子的属性数据进行预处理,得到中间种子;利用预设的权重分析模型对所述中间种子进行权重分析,得到分析结果;根据所述分析结果确定种子下载的IP溯源,并将所述种子下载的IP溯源进行可视化展示。2.根据权利要求1所述的方法,其特征在于,所述初始种子的属性数据,包括:IP地址、端口号、种子名称、哈希值、探测时间、探测状态、下载次数和邮编。3.根据权利要求1所述的方法,其特征在于,所述对所述初始种子的属性数据进行预处理,得到中间种子,包括:对所述初始种子的属性数据进行数据清洗,以对属性数据中的脏数据进行清洗,并删除属性数据中存在脏数据的初始种子,得到中间种子;利用IP定位技术,对所述中间种子进行IP定位,得到所述中间种子的经纬度和地理位置,并将所述中间种子的经纬度和地理位置添加至所述中间种子的属性数据;其中,所述中间种子的属性数据,包括:IP地址、端口号、种子名称、哈希值、经纬度、地理位置、探测时间、探测状态、下载次数和邮编。4.根据权利要求1所述的方法,其特征在于,所述利用预设的权重分析模型对所述中间种子进行权重分析,得到分析结果,包括:步骤a:令所述中间种子的探测状态为第一维度,所述中间种子的探测时间为第二维度,所述中间种子的下载次数为第三维度,与所述中间种子的IP地址相同的其他中间种子的下载次数分为第四维度;为所述第一维度、所述第二维度、所述第三维度和所述第四维度分配不同的权重,其中,所述第一维度的权重为第一权重,所述第二维度的权重为第二权重,所述第三维度的权重为第三权重,所述第四维度的权重为第四权重;步骤b:根据所述第一权重、所述第二权重、所述第三权重和所述第四权重,分别获取所述第一维度的目标分数、所述第二维度的目标分数、所述第三维度的目标分数和所述第四维度的目标分数;步骤c:根据所述第一维度的目标分数获取所述第一维度的实际分数;步骤d:根据所述第二维度的目标分数获取所述第二维度的实际分数;步骤e:根据所述第三维度的目标分数获取所述第三维度的实际分数;步骤f:根据所述第四维度的目标分数获取所述第四维度的实际分数;步骤g:所述中间种子的最终分数为所述第一维度的实际分数、所述第二维度的实际分数、所述第三维度的实际分数和所述第四维度的实际分数的总和,所述中间种子的最终分数为所述分析结果。5.根据权利要求4所述的方法,其特征在于,所述步骤b,包括:按下式确定所述第一维度的目标分数L1:L1=f*W1按下式确定所述第二维度的目标分数L2:L2=f*W2
按下式确定所述第三维度的目标分数L3:L3=f*W3按下式确定所述第四维...

【专利技术属性】
技术研发人员:陈千平
申请(专利权)人:北京奕千科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1