行为推论模型生成装置及其行为推论模型生成方法制造方法及图纸

技术编号：21432911 阅读：22 留言：0更新日期：2019-06-22 12:08

一种行为推论模型生成装置及其行为推论模型生成方法。行为推论模型生成装置利用词嵌入模型将多个程序操作序列数据的多个程序操作序列转换成多个词向量，并将各程序操作序列数据所对应的词向量中的前M个词向量输入至生成式对抗网络模型，以训练并优化生成式对抗网络模型。行为推论模型生成装置整合词嵌入模型及优化的生成式对抗网络模型的产生器，生成行为推论模型。

全部详细技术资料下载

【技术实现步骤摘要】
行为推论模型生成装置及其行为推论模型生成方法
本专利技术是关于行为推论模型生成装置及其行为推论模型生成方法。具体而言，本专利技术的行为推论模型生成装置基于词嵌入模型及优化后的生成式对抗网络模型的产生器，生成行为推论模型。
技术介绍
随着科技的发展，用户可自网络获得的应用程序也越来越多样化，某些应用程序于执行时可能会破坏用户的计算机系统，造成计算机中的档案被损毁或用户的个人信息被窃取。目前恶意程序的侦测机制主要是利用规则式特征比对，来判断应用程序是否为恶意程序，并抵御该多个恶意程序的攻击。然而，规则式特征比对的侦测机制仅基于已知样本特征进行侦测，且需在应用程序执行过程中撷取到一定数量的特征才有机会判断出目前被执行的应用程序是否为恶意程序。在此情况下，当恶意程序被侦测到时，此恶意程序可能已经造成计算机中的档案被损毁或用户的个人信息被窃取。有鉴于此，如何建立一种行为推论模型，其在应用程序被执行的初期，即可准确地推论后续的程序操作，以确实地预防计算机中的档案被损毁或用户的个人信息被窃取，乃是业界亟待解决的问题。
技术实现思路
本专利技术的目的在于提供一种行为推论模型(behaviorinferencemodel)，其在应用程序被执行的初期，即可准确地推论后续的程序操作，以确实地预防计算机中的档案被损毁或用户的个人信息被窃取。为达上述目的，本专利技术揭露一种行为推论模型生成装置，其包含一存储器及一处理器。该存储器用以存储多个程序操作序列数据。各该程序操作序列数据记载多个程序操作序列。该处理器电性连接至该存储器，并用以执行下列步骤：(a)通过一词嵌入(word...

【技术保护点】
1.一种行为推论模型生成装置，其特征在于，包含：一存储器，用以存储多个程序操作序列数据，各该程序操作序列数据记载多个程序操作序列；以及一处理器，电性连接至该存储器，并用以执行下列步骤：(a)通过一词嵌入(word embedding)模型，将各该程序操作序列数据的该多个程序操作序列转换成多个词向量，(b)针对各该程序操作序列数据，撷取该多个词向量的前M个词向量作为一生成式对抗网络(Generative Adversarial Network；GAN)模型的M个输入向量，M为一正整数；(c)针对各该程序操作序列数据，经由该GAN模型的一产生器(generator)运算该M个输入向量，以产生多个推论词向量；(d)针对各该程序操作序列数据，经由该GAN模型的一判别器(discriminator)，对该多个词向量及该多个推论词向量进行一真伪判别；(e)将该真伪判别的一判别结果反馈至该产生器，以调整该产生器的一参数设定；(f)重复该步骤(c)至该步骤(e)，训练该GAN模型，以优化该GAN模型；以及(g)整合该词嵌入模型及优化的该GAN模型的该产生器，生成一行为推论模型。

【技术特征摘要】
1.一种行为推论模型生成装置，其特征在于，包含：一存储器，用以存储多个程序操作序列数据，各该程序操作序列数据记载多个程序操作序列；以及一处理器，电性连接至该存储器，并用以执行下列步骤：(a)通过一词嵌入(wordembedding)模型，将各该程序操作序列数据的该多个程序操作序列转换成多个词向量，(b)针对各该程序操作序列数据，撷取该多个词向量的前M个词向量作为一生成式对抗网络(GenerativeAdversarialNetwork；GAN)模型的M个输入向量，M为一正整数；(c)针对各该程序操作序列数据，经由该GAN模型的一产生器(generator)运算该M个输入向量，以产生多个推论词向量；(d)针对各该程序操作序列数据，经由该GAN模型的一判别器(discriminator)，对该多个词向量及该多个推论词向量进行一真伪判别；(e)将该真伪判别的一判别结果反馈至该产生器，以调整该产生器的一参数设定；(f)重复该步骤(c)至该步骤(e)，训练该GAN模型，以优化该GAN模型；以及(g)整合该词嵌入模型及优化的该GAN模型的该产生器，生成一行为推论模型。2.如权利要求1所述的行为推论模型生成装置，其特征在于，该多个程序操作序列是一动态程序操作序列。3.如权利要求2所述的行为推论模型生成装置，其特征在于，该动态程序操作序列为一应用程序编程接口(ApplicationProgrammingInterface；API)序列。4.如权利要求2所述的行为推论模型生成装置，其特征在于，该动态程序操作序列为一系统呼叫(SystemCall)序列。5.如权利要求2所述的行为推论模型生成装置，其特征在于，该动态程序操作序列是通过一追踪程序撷取。6.如权利要求1所述的行为推论模型生成装置，其特征在于，该词嵌入模型是一词至向量(Word2Vec)模型及一独热编码(One-HotEncoding)模型其中之一。7.如权利要求1所述的行为推论模型生成装置，其特征在于，该多个程序操作序列数据中包含多个异常程序操作序列数据，以及各该异常程序操作序列数据与一恶意程序相关联。8.如权利要求1所述的行为推论模型生成装置，其特征在于，该处理器更整合一异常行为侦测模型、该词嵌入模型及优化的该GAN模型的该产生器，以生成该行为推论模型。9.如权利要求8所述的行为推论模型生成装置，其特征在于，该存储器更存储多个行为标签，各该程序操作序列数据对应至该多个行为标签其中之一，以及该处理器更执行下列步骤：基于一聚类算法，将该多个程序操作序列数据的该多个词向量分群为多个词向量群组；将各该程序操作序列数据的该多个程序操作序列分别与各该词向量群组所包含的该多个词向量中至少一者所对应的该多个程序操作序列中至少一者进行一比对，以产生各该程序操作序列数据的一特征向量；基于该多个特征向量及该多个行为标签，进行一分类算法的一监督式学习，以生成一分类器，该分类器是用以将该多个特征向量分类以对应至该多个行为标签；以及基于该多个词向量群组及该分类器，生成该异常行为侦测模型。10.如权利要求9所述的行为推论模型生成装置，其特征在于，该聚类算法是一近邻传播(AffinityPropagation；AP)聚类算法、一谱(Spectral)聚类算法、一模糊均值(FuzzyC-means；FCM)聚类算法、一迭代自组织数据分析技术算法(IterativeSelf-OrganizingDataAnalysisTechniqueAlgorithm；ISODATA)聚类算法、一K平均值(K-means)聚类算法、一完整链接(Complete-linkage；CL)聚类算法、一单一链接(Single-Linkage；SL)聚类算法及一华德法(Ward’smethod)聚类算法其中之一，以及该分类算法是一支持向量机(supportvectormachine；SVM)算法、一决策树(DecisionTree；DT)算法、一贝叶斯(Bayes)算法及一邻近(NearestNeighbors；NN)算法其中之一。11.一种用于一行为推论模型生成装置的行为推论模型生成方法，该行...

【专利技术属性】
技术研发人员：赖家民，卢嘉昱，
申请(专利权)人：财团法人资讯工业策进会，
类型：发明
国别省市：中国台湾,71

全部详细技术资料下载我是这个专利的主人