【技术实现步骤摘要】
本申请涉及数据分析,更具体地,涉及一种基于机器学习的dns查询文本数据分析方法及系统。
技术介绍
1、随着网络技术的快速发展,域名系统(dns)查询作为互联网基础设施的重要组成部分,承担着将域名解析为对应ip地址的关键任务。然而,由于dns查询的开放性和无状态性,它也成为网络攻击和恶意行为的重要渠道之一。因此,对dns查询数据进行有效分析和挖掘,以识别和预测潜在的安全风险行为,对于保障网络安全具有重要意义。
2、在传统的dns查询数据分析方法中,通常直接对原始的dns查询数据进行处理和分析,这种方法在处理大规模数据时效率低下,且难以准确提取出关键的安全风险特征。此外,现有的分析方法往往缺乏对查询文本信息的有效利用,无法充分揭示隐藏在文本中的潜在威胁。
技术实现思路
1、为改善相关技术中存在的技术问题,本申请提供了一种基于机器学习的dns查询文本数据分析方法及系统。
2、第一方面,本申请实施例提供了一种基于机器学习的dns查询文本数据分析方法,应用于文本数据分析系统,
...【技术保护点】
1.一种基于机器学习的DNS查询文本数据分析方法,其特征在于,应用于文本数据分析系统,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述第一DNS查询数据进行查询特性挖掘,得到查询特性描述向量,包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述多个查询文本嵌入向量信息中的最少一个查询文本嵌入向量信息进行查询特性映射操作,得到最少一个查询特性线性映射信息,包括:
4.根据权利要求2所述的方法,其特征在于,所述依据所述查询特性描述向量对所述查询文本预处理数据进行查询文本优化操作,得到第二DNS查询数据,包括:
5.根...
【技术特征摘要】
1.一种基于机器学习的dns查询文本数据分析方法,其特征在于,应用于文本数据分析系统,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述第一dns查询数据进行查询特性挖掘,得到查询特性描述向量,包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述多个查询文本嵌入向量信息中的最少一个查询文本嵌入向量信息进行查询特性映射操作,得到最少一个查询特性线性映射信息,包括:
4.根据权利要求2所述的方法,其特征在于,所述依据所述查询特性描述向量对所述查询文本预处理数据进行查询文本优化操作,得到第二dns查询数据,包括:
5.根据权利要求4所述的方法,其特征在于,所述对所述查询数据清洗结果进行循环文本向量嵌入处理,得到多个查询文本嵌入向量信息,包括:
6.根据权利要求4所述的方法,其特征在于,所述依据所述查询特性线性映射信息和所述查询文本嵌入向量信息对所述多个文本语义嵌入向量信息中第r个文本语义嵌入向量信息进行...
【专利技术属性】
技术研发人员:陈孝坚,张慧思,陈健文,
申请(专利权)人:广东瑞行科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。