System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据分析方法,更具体地说是指telegram数据包分析方法、装置及计算机设备。
技术介绍
1、telegram是跨平台的即时通讯软件,其客户端是自由及开放源代码软件,但服务器端是专有软件。用户可以相互交换加密与自毁消息,发送照片、影片等所有类型文件。
2、随着科技的不断发展,telegram数据包的数量和数据结构复杂性不断增加。人们使用互联网进行聊天、分享照片、视频等行为越来越普遍。但是,这些行为中包含的信息有时会对用户造成伤害,或者涉及违法行为。目前数据包分析的工作主要在数据包的数据预处理上,通过将聊天记录文件进行分析和处理,获取各种用户的信息和行为,包括用户的位置、关系、行为等,但是,并不能有效分析聊天数据和聊天对象关系,从而无法确定是否有违法行为存在。
3、因此,有必要设计一种新的方法,实现有效分析聊天数据和聊天对象关系,确定是否有违法行为存在。
技术实现思路
1、本专利技术的目的在于克服现有技术的缺陷,提供telegram数据包分析方法、装置及计算机设备。
2、为实现上述目的,本专利技术采用以下技术方案:telegram数据包分析方法,包括:
3、获取待分析的telegram数据包;
4、获取待分析的telegram数据包所对应的索引文件;
5、解析所述索引文件,以确定聊天记录文件路径以及聊天数据类型,形成待分析数据;
6、分析并处理所述待分析数据,以得到分析结果;
8、其进一步技术方案为:所述解析所述索引文件,以确定聊天记录文件路径以及聊天数据类型,形成待分析数据,包括:
9、解析所述索引文件,定位至html元素;
10、读取所述html元素中的相关信息,以得到聊天数据类型;
11、根据所述索引文件确定对应的聊天记录文件路径;
12、组合所述聊天数据类型以及所述聊天记录文件路径,形成待分析数据。
13、其进一步技术方案为:所述解析所述索引文件,以确定聊天记录文件路径以及聊天数据类型,形成待分析数据,包括:
14、解析所述索引文件,以得到联系人信息以及信息目录;
15、遍历所述信息目录下的聊天记录文件,并读取所述聊天记录文件内的记录数据,进行重新格式化并保存,以确定聊天记录文件路径以及聊天数据类型,形成待分析数据。
16、其进一步技术方案为:所述分析并处理所述待分析数据,以得到分析结果,包括:
17、分析所述待分析数据,截取所述待分析数据中的用户id、来源id以及用户姓名信息,以得到截取结果;
18、对所述截取结果进行重复数据的去重处理,以得到分析结果。
19、其进一步技术方案为:所述分类保存所述分析结果,包括:
20、对所述分析结果进行分类,并进行格式化保存。
21、本专利技术还提供了telegram数据包分析装置,包括:
22、数据包获取单元,用于获取待分析的telegram数据包;
23、索引文件获取单元,用于获取待分析的telegram数据包所对应的索引文件;
24、解析单元,用于解析所述索引文件,以确定聊天记录文件路径以及聊天数据类型,形成待分析数据;
25、分析单元,用于分析并处理所述待分析数据,以得到分析结果;
26、保存单元,用于分类保存所述分析结果。
27、其进一步技术方案为:所述解析单元包括:
28、定位子单元,用于解析所述索引文件,定位至html元素;
29、读取子单元,用于读取所述html元素中的相关信息,以得到聊天数据类型;;
30、路径确定子单元,用于根据所述索引文件确定对应的聊天记录文件路径;
31、组合子单元,用于组合所述聊天数据类型以及所述聊天记录文件路径,形成待分析数据。
32、其进一步技术方案为:所述解析单元包括:
33、目录确定子单元,用于解析所述索引文件,以得到联系人信息以及信息目录;
34、遍历子单元,用于遍历所述信息目录下的聊天记录文件,并读取所述聊天记录文件内的记录数据,进行重新格式化并保存,以确定聊天记录文件路径以及聊天数据类型,形成待分析数据。
35、本专利技术还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
36、本专利技术还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
37、本专利技术与现有技术相比的有益效果是:本专利技术通过分析待分析的telegram数据包对应的索引文件,确定聊天记录文件路径已经聊天数据类型,对这些数据重新分类,对数据内的账号信息进行提取,实现有效分析聊天数据和聊天对象关系,确定是否有违法行为存在。
38、下面结合附图和具体实施例对本专利技术作进一步描述。
本文档来自技高网...【技术保护点】
1.Telegram数据包分析方法,其特征在于,包括:
2.根据权利要求1所述的Telegram数据包分析方法,其特征在于,所述解析所述索引文件,以确定聊天记录文件路径以及聊天数据类型,形成待分析数据,包括:
3.根据权利要求1所述的Telegram数据包分析方法,其特征在于,所述解析所述索引文件,以确定聊天记录文件路径以及聊天数据类型,形成待分析数据,包括:
4.根据权利要求1所述的Telegram数据包分析方法,其特征在于,所述分析并处理所述待分析数据,以得到分析结果,包括:
5.根据权利要求1所述的Telegram数据包分析方法,其特征在于,所述分类保存所述分析结果,包括:
6.Telegram数据包分析装置,其特征在于,包括:
7.根据权利要求6所述的Telegram数据包分析装置,其特征在于,所述解析单元包括:
8.根据权利要求6所述的Telegram数据包分析装置,其特征在于,所述解析单元包括:
9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的方法。
...【技术特征摘要】
1.telegram数据包分析方法,其特征在于,包括:
2.根据权利要求1所述的telegram数据包分析方法,其特征在于,所述解析所述索引文件,以确定聊天记录文件路径以及聊天数据类型,形成待分析数据,包括:
3.根据权利要求1所述的telegram数据包分析方法,其特征在于,所述解析所述索引文件,以确定聊天记录文件路径以及聊天数据类型,形成待分析数据,包括:
4.根据权利要求1所述的telegram数据包分析方法,其特征在于,所述分析并处理所述待分析数据,以得到分析结果,包括:
5.根据权利要求1所述的telegram数据包分析方法,其特征在于,所述分类保存...
【专利技术属性】
技术研发人员:吴坚,刘翔,沈学文,朱智超,张海江,胡晓燕,汪建仙,李子叶,何雨,
申请(专利权)人:杭州平航科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。