【技术实现步骤摘要】
数据处理单元的存储器中的恶意统一资源定位符URL检测
[0001]相关申请
[0002]本申请要求2022年2月14日提交的美国临时申请第63/309,849号的权益,该申请的全部内容通过引用被合并于此。本申请与同时提交的标题为“使用机器学习检测模型在数据处理单元的存储器中的恶意活动检测(MALICIOUS ACTIVITY DETECTION IN MEMORY OF A DATA PROCESSING UNIT USING MACHINE LEARNING DETECTION MODELS)”的共同未决美国申请、同时提交的标题为“使用机器学习检测模型在数据处理单元的存储器中的勒索软件检测(RANSOMWARE DETECTION IN MEMORY OF A DATA PROCESSING UNIT USING MACHINE LEARNING DETECTION MODELS)”的共同未决美国申请,以及同时提交的标题为“使用机器学习检测模型在数据处理单元的存储器中的恶意域生成算法(DGA)检测(MALICIOUS DOMAIN GENERATION ALGORITHM(DGA)DETECTION IN MEMORY OF A DATA PROCESSING UNIT USING MACHINE LEARNING DETECTION MODELS)”的共同未决美国申请相关。
[0003]至少一个实施例涉及用于执行和促进用于检测一个或更多个计算机程序是否受到恶意活动的操作的处理资源。例如,根据本文描述的各种新型技术 ...
【技术保护点】
【技术特征摘要】
1.一种方法,包括:由数据处理单元DPU获得存储在主机设备的物理存储器中的数据的快照,所述数据与由所述主机设备执行的一个或更多个计算机程序相关联;使用机器学习ML检测系统从所述快照中提取一组特征,其中所述一组特征包括候选统一资源定位符URL中的字和所述候选URL的URL结构的数字特征;使用所述ML检测系统利用所述一组特征将所述候选URL分类为恶意的或善意的;以及响应于所述候选URL被分类为恶意的而输出恶意URL的指示。2.根据权利要求1所述的方法,其中所述ML检测系统包括二元分类模型,其被训练为使用表示候选URL中的字的令牌和所述候选URL的URL结构的数字特征将所述候选URL分类为恶意的或善意的。3.根据权利要求2所述的方法,其中所述URL结构包括子域、域、顶级域TLD、端口、路径、查询和片段中的一个或更多个。4.根据权利要求2所述的方法,其中所述二元分类模型包括:长短期记忆LSTM层,其被训练为将所述候选URL中的字令牌化为令牌;以及全连接神经网络层,其被训练为使用所述令牌和所述URL结构的所述数字特征将所述候选URL分类为恶意的或善意的。5.根据权利要求1所述的方法,其中所述ML检测系统包括二元分类模型,其被训练为通过结合所述候选URL中的字的自然语言处理NLP和所述候选URL的URL结构的特征,将所述候选URL分类为恶意的或善意的。6.根据权利要求1所述的方法,进一步包括:将所述候选URL中的字令牌化为令牌,其中所述ML检测系统包括二元分类模型,其被训练为使用所述候选URL的所述令牌和所述候选URL的URL结构的数字特征将所述候选URL分类为恶意的或善意的,并且其中所述二元分类模型包括:嵌入层,用于接收令牌作为表示所述候选URL中的字的令牌的输入序列,并基于所述令牌的输入序列生成输入向量;长短期记忆LSTM层,其被训练为基于所述输入向量生成输出向量;以及全连接神经网络层,其被训练为使用所述LSTM层的所述输出向量和所述URL结构的所述数字特征将所述候选URL分类为恶意的或善意的。7.一种集成电路,包括:主机接口,可操作地耦合至与主机设备相关联的物理存储器;中央处理单元CPU,可操作地耦合至所述主机接口;以及加速硬件引擎,可操作地耦合至所述主机接口和所述CPU,其中所述CPU和所述加速硬件引擎用于托管硬件加速的安全服务,以保护由所述主机设备执行的一个或更多个计算机程序,其中所述硬件加速的安全服务用于:获得存储在所述物理存储器中的数据的快照,所述数据与由所述主机设备执行的一个或更多个计算机程序相关联;使用机器学习ML检测系统从所述快照中提取一组特征,其中所述一组特征包括候选统一资源定位符URL中的字和所述候选URL的URL结构中的数字特征;使用所述ML检测系统利用所述一组特征将所述候选URL分类为恶意的或善意的;以及
响应于所述候选URL被分类为恶意的而输出恶意URL的指示。8.根据权利要求7所述的集成电路,其中所述集成电路是数据处理单元DPU,其中所述DPU是片上可编程数据中心基础设施。9.根据权利要求7所述的集成电路,进一步包括网络接口,其可操作地耦合至所述CPU,用于负责网络数据路径处理,其中所述CPU用于控制路径初始化和异常处理。10.根据权利要求7所述的集成电路,其中所述一个或更多个计算机程序包括至少一个主机操作系统OS、应用程序、访客操作系统或访客应用程序。11.根据权利要求7所述的集成电路,其中:所述硬件加速的安全服务用于获得存储在所述物理存储器中的所述数据的快照,所述快照表示在时间点处的所述数据;所述ML检测系统包括:特征提取逻辑,用于从所述快照中提取一组特征,所述一组特征包括候选URL中的字和所述候选URL的URL结构中的数字特征;以及二元分类模型,其被训练为使用所述一组特征将所述候选URL分类为恶意的或善意的。12.根据权利要求11所述的集成电路,其中所述特征提取逻辑用于将字令牌化为令牌,并且其中所述二元分类模型包括:嵌入层,用于接收所述令牌作为表示所述候选URL中的字的令牌的输入序...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。