基于深度学习的在线评价系统模型提取方法及装置制造方法及图纸

技术编号:34632776 阅读:8 留言:0更新日期:2022-08-24 15:05
本申请公开了一种基于深度学习的在线评价系统模型提取方法及装置,其中,方法包括:基于在线评价系统数据集中的用户打分和服务得分数据,构建关于用户

【技术实现步骤摘要】
基于深度学习的在线评价系统模型提取方法及装置


[0001]本申请涉及信息安全
,特别涉及一种基于深度学习的在线评价系统模型提取方法及装置。

技术介绍

[0002]在线评价系统正在改变人们选择商品或服务的方式,不论是线上购物,还是外出旅行、就餐,人们越来越倾向于借助在线评价系统展示的分值选择口碑好的商品或服务。在线评价系统由服务和用户两类主体组成,其中用户根据使用体验对某些服务进行打分,而系统会综合用户的打分计算服务的得分,并展示给所有用户。得分可以帮助用户进行服务选择,同时一个高的得分也会提高服务的关注度或收益,但这也导致大量网络攻击想恶意干扰服务得分,如水军刷单。为保证服务得分算法的客观性和服务得分的可信度,在线评价系统大多采用机器学习算法分析用户特征等属性,为不同用户的打分分配不同权重,如降低或取消水军打分的权重,而提高有经验的实名用户的打分的权重。由于考虑到商业机密和算法安全性等因素,在线评价系统具体的服务得分算法难以公开,从而导致服务得分算法可信度和抗攻击能力难以鉴定。
[0003]其中,模型提取可以在保护商业机密和算法安全性的前提下,提取出在线评价系统的服务得分算法,模型提取指从黑盒模型“复制”出一个替代模型。根据对抗攻击的迁移性,替代模型的可信度和抗攻击能力近似于原始模型,而“复制”来的替代模型内部结构都是公开的,因此可以通过分析替代模型来鉴定原始模型的可信度和抗攻击能力。
[0004]相关技术中,模型提取方法主要有四种:基于等式方程组、基于输入样本构造寻找决策边界、基于最优化问题和基于神经网络。基于等式方程组的模型提取方法适用于线性回归模型,如logistic回归;基于输入样本构造寻找决策边界的方法适用于分类模型,而样本构造可以根据线搜索等算法;基于最优化问题的方法把模型提取建模为最优化问题,根据目标函数的梯度等特性寻找最优解;基于神经网络的方法类似于基于最优化问题的方法,只不过适用性更广。
[0005]然而,相关技术的模型提取方法基于提取者拥有黑盒模型API(Application Programming Interface,应用程序接口)的假设,可构造任意输入进行模型提取,而在在线评价系统中,提取者只能拿到部分给定的数据,无法满足模型提取的准确需求,模型提取的难度较高,并且基于开源算法作为目标模型进行提取并测试,使得模型提取的实用性较差,无法有效对在线评价系统进行模型提取,亟待解决。

技术实现思路

[0006]本申请提供一种基于深度学习的在线评价系统模型提取方法及装置,可以在保护商业机密和算法安全性的前提下,实现在线评价系统模型提取,可适用于数据给定情况下的模型提取,实用性更强。
[0007]本申请第一方面实施例提供一种基于深度学习的在线评价系统模型提取方法,包
括以下步骤:基于在线评价系统数据集中的用户打分和服务得分数据,构建关于用户

服务的有向加权二分图,并根据所述有向加权二分图的特征进行图缩减,且将缩减后的图嵌入到矩阵中,生成预处理后的数据;基于深度学习框架构建替代模型,其中,所述替代模型以服务得到的用户打分序列为输入,输出服务得分的预测值;以及利用所述预处理后的数据,并以预设的不同超参数对所述替代模型进行模型训练,生成全局最优的替代模型。
[0008]可选地,在本申请的一个实施例中,所述基于在线评价系统数据集中的用户打分和服务得分数据,构建关于用户

服务的有向加权二分图,包括:根据所述用户打分和服务得分数据将用户和服务分别抽象成图中的多个结点,且将服务得分抽象为对应结点的属性,及将用户对服务的打分抽象为图中的多条边,打分的分值抽象为对应边的权重,生成所述有向加权二分图。
[0009]可选地,在本申请的一个实施例中,所述根据所述有向加权二分图的特征进行图缩减,包括:根据所述有向加权二分图的用户和服务结点的度分布,从所述有向加权二分图中选取大于预设度的用户结点和服务结点,生成有向加权二分子图。
[0010]可选地,在本申请的一个实施例中,所述以预设的不同超参数对所述替代模型进行模型训练,生成全局最优的替代模型,包括:选择不同的优化算法和模型结构构成多组超参数;对所述多组超参数的每组超参数进行模型训练,其中,在模型训练过程中,每隔预设轮数的迭代进行一次模型测试,以检测模型的性能与收敛情况,评估不同超参数下模型的表现;根据模型收敛速度及提取精度指标选出最优超参数组合,并基于所述最优超参数组合对应的模型为所述全局最优的替代模型。
[0011]可选地,在本申请的一个实施例中,所述替代模型为:
[0012][0013]其中,为替代模型,f为在线评价系统的服务得分算法模型,r
ij
表示为第j位用户对第i个服务的打分值。
[0014]本申请第二方面实施例提供一种基于深度学习的在线评价系统模型提取装置,包括:生成模块,用于基于在线评价系统数据集中的用户打分和服务得分数据,构建关于用户

服务的有向加权二分图,并根据所述有向加权二分图的特征进行图缩减,且将缩减后的图嵌入到矩阵中,生成预处理后的数据;构建模块,用于基于深度学习框架构建替代模型,其中,所述替代模型以服务得到的用户打分序列为输入,输出服务得分的预测值;以及提取模块,用于利用所述预处理后的数据,并以预设的不同超参数对所述替代模型进行模型训练,生成全局最优的替代模型。
[0015]可选地,在本申请的一个实施例中,所述生成模块进一步用于根据所述用户打分和服务得分数据将用户和服务分别抽象成图中的多个结点,且将服务得分抽象为对应结点的属性,及将用户对服务的打分抽象为图中的多条边,打分的分值抽象为对应边的权重,生成所述有向加权二分图,并根据所述有向加权二分图的用户和服务结点的度分布,从所述有向加权二分图中选取大于预设度的用户结点和服务结点,生成有向加权二分子图。
[0016]可选地,在本申请的一个实施例中,所述提取模块包括:选择单元,用于选择不同的优化算法和模型结构构成多组超参数;训练单元,用于对所述多组超参数的每组超参数进行模型训练,其中,在模型训练过程中,每隔预设轮数的迭代进行一次模型测试,以检测
模型的性能与收敛情况,评估不同超参数下模型的表现;获取单元,用于根据模型收敛速度及提取精度指标选出最优超参数组合,并基于所述最优超参数组合对应的模型为所述全局最优的替代模型。
[0017]本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的基于深度学习的在线评价系统模型提取方法。
[0018]本申请第四方面实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上述实施例所述的基于深度学习的在线评价系统模型提取方法。
[0019]本申请实施例可以基于深度学习框架构建替代模型,利用经过图缩减预处理的在线评价系统本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的在线评价系统模型提取方法,其特征在于,包括以下步骤:基于在线评价系统数据集中的用户打分和服务得分数据,构建关于用户

服务的有向加权二分图,并根据所述有向加权二分图的特征进行图缩减,且将缩减后的图嵌入到矩阵中,生成预处理后的数据;基于深度学习框架构建替代模型,其中,所述替代模型以服务得到的用户打分序列为输入,输出服务得分的预测值;以及利用所述预处理后的数据,并以预设的不同超参数对所述替代模型进行模型训练,生成全局最优的替代模型。2.根据权利要求1所述的方法,其特征在于,所述基于在线评价系统数据集中的用户打分和服务得分数据,构建关于用户

服务的有向加权二分图,包括:根据所述用户打分和服务得分数据将用户和服务分别抽象成图中的多个结点,且将服务得分抽象为对应结点的属性,及将用户对服务的打分抽象为图中的多条边,打分的分值抽象为对应边的权重,生成所述有向加权二分图。3.根据权利要求1所述的方法,其特征在于,所述根据所述有向加权二分图的特征进行图缩减,包括:根据所述有向加权二分图的用户和服务结点的度分布,从所述有向加权二分图中选取大于预设度的用户结点和服务结点,生成有向加权二分子图。4.根据权利要求1所述的方法,其特征在于,所述以预设的不同超参数对所述替代模型进行模型训练,生成全局最优的替代模型,包括:选择不同的优化算法和模型结构构成多组超参数;对所述多组超参数的每组超参数进行模型训练,其中,在模型训练过程中,每隔预设轮数的迭代进行一次模型测试,以检测模型的性能与收敛情况,评估不同超参数下模型的表现;根据模型收敛速度及提取精度指标选出最优超参数组合,并基于所述最优超参数组合对应的模型为所述全局最优的替代模型。5.根据权利要求1

4任一项所述的方法,其特征在于,所述替代模型为:其中,为替代模型,f为在线评价系统的服务得分算法模型,r
ij
表示为第j位用户对第i个服务的打分值。6.一种基于深度学习的在...

【专利技术属性】
技术研发人员:毛剑刘力沛罗喜伶林其箫
申请(专利权)人:北京航空航天大学杭州创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1