一种业务同设备识别方法、装置、计算设备及存储介质制造方法及图纸

技术编号:15691334 阅读:43 留言:0更新日期:2017-06-24 04:27
本发明专利技术提供了一种业务同设备识别方法、装置、计算设备及存储介质,其中,该方法包括:获取作弊样本数据和非作弊样本数据,利用作弊样本数据和非作弊样本数据进行机器学习,建立评价模型;获取两个业务信息,根据评价模型,确定两个业务信息是否来源于同一设备。本发明专利技术根据样本数据建立了评价模型,通过该评价模型在线判断两个业务信息是否来源于同一个设备,避免依赖事后人工反查,提高了识别的准确性及效率。同时该评价模型可周期性进行更新,对伪装设备的防御更加全面,恶意份子很难绕开评价模型的识别。

Service and device identification method, device, computing device and storage medium

The invention provides a service with equipment identification method and device, computing device and storage medium, wherein, the method comprises: acquiring sample data and non cheating cheating cheating in the sample data, using sample data for machine learning and non cheating sample data, establish the evaluation model; obtaining two business information, according to the evaluation model. To determine the two business information is derived from the same equipment. The invention establishes an evaluation model based on the sample data, the evaluation model of online judge two business information is derived from the same equipment, avoid dependence after artificial counter check, improve the accuracy and efficiency of recognition. At the same time, the evaluation model can be updated periodically, and the defense of camouflage equipment is more comprehensive. It is difficult for the malicious elements to bypass the identification of the evaluation model.

【技术实现步骤摘要】
一种业务同设备识别方法、装置、计算设备及存储介质
本专利技术涉及互联网
,具体而言,涉及一种业务同设备识别方法、装置、计算设备及存储介质。
技术介绍
目前,恶意份子通过修改设备的设备信息或网络环境信息,将设备伪装成多个不同设备,发送大量的业务信息进行作弊以谋取利益。为了维护正常用户的利益,需要识别不同的业务信息是否来源于同一设备,从而识破恶意份子的伪装。当前,通常根据已确认的作弊案例,通过人工业务反查的方式来识别作弊业务信息。对于已确认的作弊案例,技术人员分析恶意份子伪装的每个设备的设备信息、网络环境信息和业务信息,从中找出伪装的多个设备中均相同的不变量,将找出的不变量组合为一个新的变量。利用该新的变量来识别不同业务信息是否来自同一设备。上述依赖事后人工反查的方式确定一个变量,利用确定的变量来识别作弊业务信息,准确性很低,且确定的变量很难覆盖伪装出的所有设备,对于新出现的不变量往往无法防御。且易造成多个变量共同防御的情况,增加管理的时间成本,导致无法有效观察不同变量的表现情况。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提供一种业务同设备识别方法、装置、计算设备及存储介质,通过该评价模型在线判断两个业务信息是否来源于同一个设备,避免依赖事后人工反查,提高了识别的准确性及效率。同时该评价模型可周期性进行更新,对伪装设备的防御更加全面,恶意份子很难绕开评价模型的识别。第一方面,本专利技术实施例提供了一种业务同设备识别方法,所述方法包括:获取作弊样本数据和非作弊样本数据,利用所述作弊样本数据和所述非作弊样本数据进行机器学习,建立评价模型;获取两个业务信息,根据所述评价模型,确定所述两个业务信息是否来源于同一设备。结合第一方面,本专利技术实施例提供了上述第一方面的第一种可能的实现方式,其中,所述利用所述作弊样本数据和所述非作弊样本数据进行机器学习,建立评价模型,包括:获取所述作弊样本数据对应的作弊关系对,及获取所述非作弊样本数据对应的非作弊关系对;获取每个作弊关系对对应的特征向量,及获取每个非作弊关系对对应的特征向量;利用所述每个作弊关系对、所述每个作弊关系对对应的特征向量、所述每个非作弊关系对及所述每个非作弊关系对对应的特征向量进行机器学习,获得评价模型。结合第一方面的第一种可能的实现方式,本专利技术实施例提供了上述第一方面的第二种可能的实现方式,其中,所述获取所述作弊样本数据对应的作弊关系对,及获取所述非作弊样本数据对应的非作弊关系对,包括:将所述作弊样本数据中属于同一设备的业务信息两两组合为作弊关系对;将所述非作弊样本数据中属于不同设备的业务信息两两组合为非作弊关系对。结合第一方面的第一种可能的实现方式,本专利技术实施例提供了上述第一方面的第三种可能的实现方式,其中,所述获取每个作弊关系对对应的特征向量,及获取每个非作弊关系对对应的特征向量,包括:比对作弊关系对包括的两个业务信息中同一特征的特征值是否相同;如果是,则将特征值相同的特征对应的向量元素值设置为第一预设数值;如果否,则将特征值不同的特征对应的向量元素值设置为第二预设数值;将所述作弊关系对对应的所有向量元素值构成所述作弊关系对对应的特征向量;比对非作弊关系对包括的两个业务信息中同一特征的特征值是否相同;如果是,则将特征值相同的特征对应的向量元素值设置为第一预设数值;如果否,则将特征值不同的特征对应的向量元素值设置为第二预设数值;将所述非作弊关系对对应的所有向量元素值构成所述非作弊关系对对应的特征向量。结合第一方面,本专利技术实施例提供了上述第一方面的第四种可能的实现方式,其中,所述根据所述评价模型,确定所述两个业务信息是否来源于同一设备,包括:根据获取的两个业务信息,获取所述两个业务信息对应的特征向量;根据所述两个业务信息和所述特征向量,通过所述评价模型确定所述两个业务信息是否来源于同一设备。结合第一方面的第四种可能的实现方式,本专利技术实施例提供了上述第一方面的第五种可能的实现方式,其中,所述根据所述两个业务信息和所述特征向量,通过所述评价模型确定所述两个业务信息是否来源于同一设备,包括:根据所述两个业务信息和所述特征向量,通过所述评价模型对所述两个业务信息进行打分,得到所述两个业务信息对应的同源分数;根据所述同源分数和预设分值,确定所述两个业务信息是否来源于同一设备。结合第一方面的第四种可能的实现方式,本专利技术实施例提供了上述第一方面的第六种可能的实现方式,其中,所述根据获取的两个业务信息,获取所述两个业务信息对应的特征向量,包括:比对所述两个业务信息中同一特征的特征值是否相同;如果是,则在所述两个业务信息对应的特征向量中,将特征值相同的特征对应的向量元素值设置为第一预设数值;如果否,则在所述两个业务信息对应的特征向量中,将特征值不同的特征对应的向量元素值设置为第二预设数值;将所述两个业务信息对应的所有所述向量元素值构成所述两个业务信息对应的特征向量。结合第一方面的第一种可能的实现方式,本专利技术实施例提供了上述第一方面的第七种可能的实现方式,其中,所述获取所述作弊样本数据对应的作弊关系对,及获取所述非作弊样本数据对应的非作弊关系对,包括:将所述作弊样本数据中属于同一设备且预设特征一致的业务信息两两组合为作弊关系对;将所述非作弊样本数据中属于不同设备且所述预设特征一致的业务信息两两组合为非作弊关系对。结合第一方面的第七种可能的实现方式,本专利技术实施例提供了上述第一方面的第八种可能的实现方式,其中,所述获取每个作弊关系对对应的特征向量,及获取每个非作弊关系对对应的特征向量,包括:比对作弊关系对包括的两个业务信息中除所述预设特征外的其他特征,获得所述作弊关系对对应的特征向量;比对非作弊关系对包括的两个业务信息中除所述预设特征外的其他特征,获得所述非作弊关系对对应的特征向量。结合第一方面的第七种可能的实现方式,本专利技术实施例提供了上述第一方面的第九种可能的实现方式,其中,所述获取两个业务信息,根据所述评价模型,确定所述两个业务信息是否来源于同一设备,包括:获取所述预设特征一致的两个业务信息;比对获取的所述两个业务信息中除所述预设特征外的其他特征,得到所述两个业务信息对应的特征向量;根据所述两个业务信息和所述特征向量,通过所述评价模型确定所述两个业务信息是否来源于同一设备。结合第一方面及第一方面的第一至第九种实现方式中的任一种实现方式,本专利技术实施例提供了上述第一方面的第十种实现方式,其中,所述方法还包括:每隔预设时间段获取过去离当前时间最近的所述预设时间段内的作弊样本数据和非作弊样本数据,根据所述预设时间段内的所述作弊样本数据和所述非作弊样本数据,更新所述评价模型。第二方面,本专利技术实施例提供了一种业务同设备识别装置,所述装置包括:模型建立模块,用于获取作弊样本数据和非作弊样本数据,利用所述作弊样本数据和所述非作弊样本数据进行机器学习,建立评价模型;获取模块,用于获取两个业务信息;确定模块,用于根据所述评价模型,确定所述两个业务信息是否来源于同一设备。结合第二方面,本专利技术实施例提供了上述第二方面的第一种可能的实现方式,其中,所述模型建立模块包括:第一获取单元,用于获取所述作弊样本数据对应的作弊关系对,及获取所述非作弊样本数据对应的非作弊关系对;获取每个作弊关系对对应的本文档来自技高网...
一种业务同设备识别方法、装置、计算设备及存储介质

【技术保护点】
一种业务同设备识别方法,其特征在于,所述方法包括:获取作弊样本数据和非作弊样本数据,利用所述作弊样本数据和所述非作弊样本数据进行机器学习,建立评价模型;获取两个业务信息,根据所述评价模型,确定所述两个业务信息是否来源于同一设备。

【技术特征摘要】
2017.01.04 CN 20171000417491.一种业务同设备识别方法,其特征在于,所述方法包括:获取作弊样本数据和非作弊样本数据,利用所述作弊样本数据和所述非作弊样本数据进行机器学习,建立评价模型;获取两个业务信息,根据所述评价模型,确定所述两个业务信息是否来源于同一设备。2.根据权利要求1所述的方法,其特征在于,所述利用所述作弊样本数据和所述非作弊样本数据进行机器学习,建立评价模型,包括:获取所述作弊样本数据对应的作弊关系对,及获取所述非作弊样本数据对应的非作弊关系对;获取每个作弊关系对对应的特征向量,及获取每个非作弊关系对对应的特征向量;利用所述每个作弊关系对、所述每个作弊关系对对应的特征向量、所述每个非作弊关系对及所述每个非作弊关系对对应的特征向量进行机器学习,获得评价模型。3.根据权利要求2所述的方法,其特征在于,所述获取所述作弊样本数据对应的作弊关系对,及获取所述非作弊样本数据对应的非作弊关系对,包括:将所述作弊样本数据中属于同一设备的业务信息两两组合为作弊关系对;将所述非作弊样本数据中属于不同设备的业务信息两两组合为非作弊关系对。4.根据权利要求2所述的方法,其特征在于,所述获取每个作弊关系对对应的特征向量,及获取每个非作弊关系对对应的特征向量,包括:比对作弊关系对包括的两个业务信息中同一特征的特征值是否相同;如果是,则将特征值相同的特征对应的向量元素值设置为第一预设数值;如果否,则将特征值不同的特征对应的向量元素值设置为第二预设数值;将所述作弊关系对对应的所有向量元素值构成所述作弊关系对对应的特征向量;比对非作弊关系对包括的两个业务信息中同一特征的特征值是否相同;如果是,则将特征值相同的特征对应的向量元素值设置为第一预设数值;如果否,则将特征值不同的特征对应的向量元素值设置为第二预设数值;将所述非作弊关系对对应的所有向量元素值构成所述非作弊关系对对应的特征向量。5.根据权利要求1所述的方法,其特征在于,所述根据所述评价模型,确定所述两个业务信息是否来源于同一设备,包括:根据获取的两个业务信息,获取所述两个业务信息对应的特征向量;根据所述两个业务信息和所述特征向量,通过所述评价模型确定所述两个业务信息是否来源于同一设备。6.根据权利要求5所述的方法,其特征在于,所述根据所述两个业务信息和所述特征向量,通过所述评价模型确定所述两个业务信息是否来源于同一设备,包括:根据所述两个业务信息和所述特征向量,通过所述评价模型对所述两个业务信息进行打分,得到所述两个业务信息对应的同源分数;根据所述同源分数和预设分值,确定所述两个业务信息是否来源于同一设备。7.根据权利要求5所述的方法,其特征在于,所述根据获取的两个业务信息,获取所述两个业务信息对应的特征向量,包括:比对所述两个业务信息中同一特征的特征值是否相同;如果是,则在所述两个业务信息对应的特征向量中,将特征值相同的特征对应的向量元素值设置为第一预设数值;如果否,则在所述两个业务信息对应的特征向量中,将特...

【专利技术属性】
技术研发人员:汪浩然邵纪东沐广武周达
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1