域名识别和域名识别模型生成方法、装置及存储介质制造方法及图纸

技术编号:22295501 阅读:41 留言:0更新日期:2019-10-15 04:39
本说明书实施例公开了一种域名识别和域名识别模型生成方法、装置及存储介质,涉及网络技术领域,所述方法包括:获取待分类域名所对应的一维有序向量,所述一维有序向量包括将所述待分类域名进行字符数字转换后得到的数字,根据所述一维有序向量和预设的神经网络模型,确定所述待分类域名的检测值,所述神经网络模型包括根据预设的损失函数和优化算法进行训练后,满足预设条件的神经网络模型,对比所述检测值和指定中间值,并根据对比结果确定所述待分类域名的检测结果。通过本说明书实施例可以提高识别准确率。

Generation Method, Device and Storage Medium of Domain Name Recognition and Domain Name Recognition Model

【技术实现步骤摘要】
域名识别和域名识别模型生成方法、装置及存储介质
本说明书涉及网络
,特别涉及一种域名识别和域名识别模型生成方法、装置及存储介质。
技术介绍
域名生成算法,简称DGA,是一种利用随机字符来生成C&C域名,从而逃避域名黑名单检测的技术手段。攻击者通常选择高效的域名生成算法,在一天内就可以生成海量的C&C域名。然而,现有的黑名单技术,只能排除现有的非法域名,并不能排除新生成的非法域名,所以识别准确率低,不能满足现有的域名检测要求。目前传统的人工识别方法,是根据具有一定安全领域专业知识及经验的人通过观察总结的方式进行识别,但是黑客使用的DGA算法可以是任意一种类转码、加密或随机规则算法,且这样的算法种类非常繁多,如果仅通过现有的DGA算法的结果样本进行特征总结,存在着很大的局限性,识别效果不理想,识别准确率低。现有的非神经网络方法,往往首先需要按照分词规则对域名样本集合进行分词处理,得到分词集合,再基于分词集合得到识别结果,但是按照分词规则建立分词集合的方式,对后续识别效果产生一定的影响,导致识别精度不高。现有的全连接神经网络,由于不具备短期记忆特性,且不能够对数据序列进行预测,导致识别准确率不高。由上可见,现有的域名识别方法,均不能达到很高的识别准确率。
技术实现思路
本说明书实施方式的目的是提供一种域名识别和域名识别模型生成方法、装置及存储介质,以提高域名识别准确率。为实现上述目的,本说明书实施例提供了一种域名识别方法,可以包括:获取待分类域名所对应的一维有序向量;所述一维有序向量包括将所述待分类域名进行字符数字转换后得到的数字;根据所述一维有序向量和预设的神经网络模型,确定所述待分类域名的检测值;所述神经网络模型包括根据预设的损失函数和优化算法进行训练后,得到满足预设条件的神经网络模型;对比所述检测值和指定中间值,并根据对比结果确定所述待分类域名的检测结果。进一步地,所述方法的另一些实施例中,所述对比所述检测值和指定中间值,并根据对比结果确定所述待分类域名的检测结果,可以包括:将待分类域名的检测值与指定中间值进行大小比较,判断所述检测值是否大于指定中间值;如果所述检测值大于所述指定中间值,则确定所述待分类域名为非法域名;如果所述检测值小于所述指定中间值,则确定所述待分类域名为合法域名。进一步地,所述方法的另一些实施例中,所述对比所述检测值和指定中间值,并根据对比结果确定所述待分类域名的检测结果,可以包括:将待分类域名的检测值与指定中间值进行大小比较,判断所述检测值是否小于指定中间值;如果所述检测值小于所述指定中间值,则确定所述待分类域名为非法域名;如果所述检测值大于所述指定中间值,则确定所述待分类域名为合法域名。进一步地,所述方法的另一些实施例中,所述获取待分类域名所对应的一维有序向量,可以包括:获取待分类域名对应的第一字符串;根据字符和数字的对应关系,将所述第一字符串中的字符转换成对应的数字,并生成所述第一字符串对应的一维有序向量。进一步地,所述方法的另一些实施例中,所述生成所述第一字符串对应的一维有序向量,可以包括:判断第一字符串对应的一维有序向量的长度是否小于指定长度;如果所述长度小于所述指定长度,则对所述一维有序向量的尾部进行补值,得到指定长度的一维有序向量。进一步地,所述方法的另一些实施例中,所述获取待分类域名对应的第一字符串,可以包括:获取待分类域名;将所述待分类域名的前缀或/和后缀进行滤除,得到所述待分类域名对应的第一字符串。进一步地,所述方法的另一些实施例中,所述获取待分类域名,至少可以包括以下任意一种:根据预设的域名生成算法,生成待分类域名;根据ALEXA排行榜,获取待分类域名;根据浏览网页的网址,提取出待分类域名。为实现上述目的,本说明书实施例又提供了一种域名识别模型生成方法,可以包括:获取训练矩阵;所述训练矩阵包括多个训练域名对应的一维有序向量;所述一维有序向量包括将多个训练域名进行字符数字转换后得到的数字;根据预设的损失函数,计算训练实际值和训练预期值之间的损失值;所述训练实际值根据所述训练矩阵和初始神经网络模型得到;根据预设的优化函数和所述损失值,对所述初始神经网络模型进行优化,得到优化后的神经网络模型。进一步地,所述方法的另一些实施例中,在获取训练矩阵之前,可以包括:获取预设的总训练轮数;将所述总训练轮数与当前训练轮数进行大小比较,判断所述当前训练轮数是否小于或等于所述总训练轮数;如果所述当前训练轮数小于或等于所述总训练轮数,则获取训练矩阵。进一步地,所述方法的另一些实施例中,在得到优化后的神经网络模型之后,可以包括:更新当前训练轮数。进一步地,所述方法的另一些实施例中,在得到优化后的神经网络模型之后,还可以包括:获取验证矩阵;所述验证矩阵包括多个验证域名对应的一维有序向量;所述一维有序向量包括多个验证域名进行字符数字转换后得到的数字;根据所述验证矩阵和优化后的神经网络模型,确定所述验证矩阵对应的准确率;根据所述准确率、当前容忍值和指定容忍值,确定所述神经网络模型是否为满足预设条件的神经网络模型。进一步地,所述方法的另一些实施例中,所述根据所述验证矩阵和优化后的神经网络模型,确定所述验证矩阵对应的准确率,可以包括:根据验证矩阵和优化后的神经网络模型,得到与所述验证矩阵对应的多个验证域名的验证实际值;根据所述验证实际值和验证预期值,得到多个所述验证域名的检测结果;根据所述检测结果,确定所述验证矩阵的准确率。进一步地,所述方法的另一些实施例中,所述根据所述准确率、当前容忍值和指定容忍值,确定所述神经网络模型是否为满足预设条件的神经网络模型,可以包括:将验证矩阵的准确率与指定准确率进行大小比较,判断所述准确率是否小于所述指定准确率;如果所述准确率小于所述指定准确率,则更新当前容忍值,并判断更新后的当前容忍值是否大于指定容忍值;如果所述当前容忍值大于所述指定容忍值,则确定优化后的神经网络模型为满足预设条件的神经网络模型。进一步地,所述方法的另一些实施例中,在确定优化后的神经网络模型为满足预设条件的神经网络模型之前,还可以包括:获取测试矩阵;所述测试矩阵包括多个测试域名对应的一维有序向量;所述一维有序向量包括多个测试域名进行字符数字转换后得到的数字;根据所述测试矩阵和优化后的神经网络模型,确定多个所述测试域名的检测结果;判断所述检测结果和预设结果是否相同;如果所述检测结果和所述预设结果相同,则确定所述神经网络模型为满足预设条件的神经网络模型。另一方面,本说明书实施例提供了一种域名识别装置,可以包括:获取模块,用于获取待分类域名所对应的一维有序向量;所述一维有序向量包括将所述待分类域名进行字符数字转换后得到的数字;确定模块,用于根据所述一维有序向量和预设的神经网络模型,确定所述待分类域名的检测值;所述神经网络模型包括根据预设的损失函数和优化算法进行训练后,得到满足预设条件的神经网络模型;检测模块,用于对比所述检测值和指定中间值,并根据对比结果确定所述待分类域名的检测结果。进一步地,所述设备的另一些实施例中,所述获取模块,可以包括:获取单元,用于获取待分类域名对应的第一字符串;转换生成单元,用于根据字符和数字的对应关系,将所述第一字符串中的字符转换成对应的数本文档来自技高网...

【技术保护点】
1.一种域名识别方法,其特征在于,包括:获取待分类域名所对应的一维有序向量;所述一维有序向量包括将所述待分类域名进行字符数字转换后得到的数字;根据所述一维有序向量和预设的神经网络模型,确定所述待分类域名的检测值;所述神经网络模型包括根据预设的损失函数和优化算法进行训练后,得到满足预设条件的神经网络模型;对比所述检测值和指定中间值,并根据对比结果确定所述待分类域名的检测结果。

【技术特征摘要】
1.一种域名识别方法,其特征在于,包括:获取待分类域名所对应的一维有序向量;所述一维有序向量包括将所述待分类域名进行字符数字转换后得到的数字;根据所述一维有序向量和预设的神经网络模型,确定所述待分类域名的检测值;所述神经网络模型包括根据预设的损失函数和优化算法进行训练后,得到满足预设条件的神经网络模型;对比所述检测值和指定中间值,并根据对比结果确定所述待分类域名的检测结果。2.根据权利要求1所述的方法,其特征在于,所述对比所述检测值和指定中间值,并根据对比结果确定所述待分类域名的检测结果,包括:将待分类域名的检测值与指定中间值进行大小比较,判断所述检测值是否大于指定中间值;如果所述检测值大于所述指定中间值,则确定所述待分类域名为非法域名;如果所述检测值小于所述指定中间值,则确定所述待分类域名为合法域名。3.根据权利要求1所述的方法,其特征在于,所述对比所述检测值和指定中间值,并根据对比结果确定所述待分类域名的检测结果,包括:将待分类域名的检测值与指定中间值进行大小比较,判断所述检测值是否小于指定中间值;如果所述检测值小于所述指定中间值,则确定所述待分类域名为非法域名;如果所述检测值大于所述指定中间值,则确定所述待分类域名为合法域名。4.根据权利要求1所述的方法,其特征在于,所述获取待分类域名所对应的一维有序向量,包括:获取待分类域名对应的第一字符串;根据字符和数字的对应关系,将所述第一字符串中的字符转换成对应的数字,并生成所述第一字符串对应的一维有序向量。5.根据权利要求4所述的方法,其特征在于,所述生成所述第一字符串对应的一维有序向量,包括:判断第一字符串对应的一维有序向量的长度是否小于指定长度;如果所述长度小于所述指定长度,则对所述一维有序向量的尾部进行补值,得到指定长度的一维有序向量。6.根据权利要求4所述的方法,其特征在于,所述获取待分类域名对应的第一字符串,包括:获取待分类域名;将所述待分类域名的前缀和后缀进行滤除,得到所述待分类域名对应的第一字符串。7.根据权利要求6所述的方法,其特征在于,所述获取待分类域名,至少包括以下任意一种:根据预设的域名生成算法,生成待分类域名;根据ALEXA排行榜,获取待分类域名;根据浏览网页的网址,提取出待分类域名。8.一种域名识别模型生成方法,其特征在于,包括:获取训练矩阵;所述训练矩阵包括多个训练域名对应的一维有序向量;所述一维有序向量包括将多个训练域名进行字符数字转换后得到的数字;根据预设的损失函数,计算训练实际值和训练预期值之间的损失值;所述训练实际值根据所述训练矩阵和初始神经网络模型得到;根据预设的优化函数和所述损失值,对所述初始神经网络模型进行优化,得到优化后的神经网络模型。9.根据权利要求8所述的方法,其特征在于,在获取训练矩阵之前,还包括:获取预设的总训练轮数;将所述总训练轮数与当前训练轮数进行大小比较,判断所述当前训练轮数是否小于或等于所述总训练轮数;如果所述当前训练轮数小于或等于所述总训练轮数,则获取训练矩阵。10.根据权利要求8所述的方法,其特征在于,在得到优化后的神经网络模型之后,还包括:更新当前训练轮数。11.根据权利要求8所述的方法,其特征在于,在得到优化后的神经网络模型之后,还包括:获取验证矩阵;所述验证矩阵包括多个验证域名对应的一维有序向量;所述一维有序向量包括多个验证域名进行字符数字转换后得到的数字;根据所述验证矩阵和优化后的神经网络模型,确定所述验证矩阵对应的准确率;根据所述准确率、当前容忍值和指定容忍值,确定所述神经网络模型是否为满足预设条件的神经网络模型。12.根据权利要求11所述的方法,其特征在于,所述根据所述验证矩阵和优化后的神经网络模型,确定所述验证矩阵对应的准确率,包括:根据验证矩阵和优化后的神经网络模型,得到与所述验证矩阵对应的多个验证域名的验证实际值;根据所述验证实际值和验证预期值,得到多个所述验证域名的检测结果;根据所述检测结果,确定所述验证矩阵的准确率。13.根据权利要求11所述的方法,其特征在于,所述根据所述准确率、当前容忍值和指定容忍值,确定所述神经网络模型是否为满足预设条件的神经网络模型,包括:将验证矩阵的准确率与指定准确率进行大小比较,判断所述准确率是否小于所述指定准确率;如果所述准确率小于所述指定准确率,则更新当前容忍值,并判断更新后的当前容忍值是否大于指定容忍值;如果所述当前容忍值大于所述指定容忍值,则确定优化后的神经网络模型为满足预设条件的神经网络模型。14.根据权利要求11所述的方法,其特征在于,在确定优化后的神经网络模型为满足预设条件的神经网络模型之前,还包括:获取测试矩阵;所述测试矩阵包括多个测试域名对应的一维有序向量;所述一维有序向量包括多个测试域名进行字符数字转换后得到的数字;根据所述测试矩阵和优化后的神经网络模型,确定多个所述测试域名的检测结果;判断所述检测结果和预设结果是否相同;如果所述检测结果和所述预设结果相同,则确定所述神经网络模型为满足预设条件...

【专利技术属性】
技术研发人员:陆子辉张军杰邢正强
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1