System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种针对学习型索引推荐系统的投毒攻击方法及系统技术方案_技高网
当前位置: 首页 > 专利查询>厦门大学专利>正文

一种针对学习型索引推荐系统的投毒攻击方法及系统技术方案

技术编号:40900890 阅读:5 留言:0更新日期:2024-04-18 11:18
本发明专利技术公开了一种针对学习型索引推荐系统的投毒攻击方法及系统,包括:首先,在黑盒场景设置下提出了探测索引偏好的方法,基于学习型索引推荐模型对不同工作负载的推荐结果提取其对不同索引列的偏好排序,以指导投毒攻击步骤;其次,设计了用于将学习型索引推荐模型困于局部最优解的攻击工作负载,将其混入正常工作负载投入学习型索引推荐系统从而实现投毒。本发明专利技术能够有效地对现有的学习型索引推荐系统进行投毒攻击,大大地降低其索引推荐的效果。

【技术实现步骤摘要】

本专利技术涉及无人深度学习,特别涉及一种包括探测—投毒两阶段的针对黑盒场景下针对学习型索引推荐系统的投毒攻击方法及系统


技术介绍

1、随着数据规模和数据种类的不断增加,数据库的应用场景也越来越广泛,从个人电脑上的本地数据库到企业级的分布式数据库,甚至到云端的数据库服务,数据库已经成为了现代计算机系统的重要组成部分。在大量数据的存储和管理方面,数据库系统凭借其高效、稳定、可靠的特点,成为了企业和组织的首选。同时,随着互联网的不断普及,数据库的应用场景也不断扩展,从传统的关系型数据库到nosql数据库、图数据库、列存储数据库等多种类型,使得数据库在现代信息化建设中扮演着不可替代的角色。

2、在这样的应用场景下,数据库索引的优化与管理也变得至关重要。索引作为数据库中最基本、最常用的一种优化方式,可以大大提高数据库的查询效率。然而,不同的应用场景、不同的查询方式和数据特征,都需要不同的索引优化方式,而索引的错误选择或不当管理也可能导致查询效率低下、存储空间浪费等问题。同时,索引的建立需要占用大量的磁盘空间和计算资源,而当数据量达到一定规模时,索引的维护和更新也会变得非常耗费时间和计算资源。因此,针对不同的应用场景,如何选择适合的索引、如何对索引进行合理的管理和维护,成为了数据库优化和管理中的重要问题。

3、为了解决这一问题,近年来,越来越多的数据库管理系统开始采用基于机器学习的索引推荐系统。这种系统可以通过分析数据库的访问模式和数据分布情况,自动为每个查询建议最优索引,并且在需要时自动对索引进行优化。这样可以大大提高数据库的查询效率和响应速度。

4、然而,在实际应用中,由于多个用户共享同一个数据库,索引的选择和优化往往涉及到多个用户的数据访问模式和需求。如果针对某个特定的用户,通过恶意查询来欺骗索引推荐系统,从而影响其他用户的查询效率,就可能会对整个数据库的性能产生巨大影响。因此,针对多用户索引推荐系统的攻击研究变得尤为重要。

5、现有的索引推荐系统大致可分为两大类:基于启发式方法的索引推荐系统和基于学习型的索引推荐系统。其中,基于学习型的索引推荐系统,相比于启发式的索引推荐系统在索引推荐的准确性和效率上展示出了更多的潜力。基于学习型的索引推荐系统把在关系型数据库中的索引推荐过程建模为一个强化学习过程,以从底层数据和工作负载中学习到知识来进行索引的选择。然而,正因此,其学习过程对训练数据具有严重的依赖性,而其训练数据又往往来自于用户的查询,这就引入了一个新的安全问题,即模型在更新过程中存在被投入有毒数据的风险。一旦存在别有用心的用户投入了足以影响数据库整体性能的有毒数据,索引推荐系统在使用混有有毒数据的训练数据完成更新后就会降低对其他用户进行正常推荐索引的能力,从而影响其他用户对数据库的使用体验。


技术实现思路

1、本专利技术的目的是针对黑盒场景下现有的学习型索引推荐系统所存在的安全问题,提出一种针对学习型索引推荐系统的投毒攻击方法及系统。

2、本专利技术采用如下技术方案:

3、一种针对学习型索引推荐系统的投毒攻击方法,包括:

4、s101,通过自动状态机随机生成工作负载,并让学习型索引推荐系统为生成的工作负载推荐索引作为iabart的训练数据,训练一个根据投入列集合生成推荐这些列集合作为索引的工作负载的工作负载生成器iabart;

5、s102,初始化学习型索引推荐系统的列偏好为均匀分布;

6、s103,根据现有的列偏好信息依概率进行列采样,将采样得到的列集合投入iabart中生成探测工作负载,将探测工作负载注入索引推荐系统中,让其进行索引推荐,获得索引推荐结果;

7、s104,基于索引推荐结果更新索引列偏好信息;并循环s102~s104这整个探测阶段,共预设次数;

8、s105,根据探测阶段得到的学习型索引推荐系统的列偏好信息,依概率采样偏好列,生成投毒工作负载;

9、s106,将投毒工作负载与正常工作负载混合后注入数据库,实现对学习型索引推荐系统的投毒。

10、在s101中,通过自动状态机随机生成工作负载,并让索引推荐系统为这些工作负载推荐索引,最后将查询、索引和索引性能三者通过特殊分隔符<sep>拼接在一起,作为iabart的训练数据,并使用提出的能够提升模型学习能力的新颖的训练方法——渐进式掩码训练任务来进行训练,同时加入设计的sub-token级别的自动状态机来保证生成查询的语法正确性,来训练一个能够根据投入列集合生成能够推荐这些列集合作为索引的工作负载的工作负载生成器iabart。

11、在s102中,初始化学习型索引推荐系统的列偏好为均匀分布。这是为了让初始列偏好保持各个列一致,以保证探测的公平性。

12、在s103中,根据现有的列偏好信息依概率进行列采样,将采样得到的列集合投入iabart中生成探测工作负载,将探测工作负载注入索引推荐系统中,让其进行索引推荐。以获取学习型索引推荐系统对采样列生成的探测工作负载的索引推荐结果,根据此结果更新索引推荐系统的偏好列排序。

13、在s104中,观察索引推荐结果并更新索引列偏好信息,到此为止为探测阶段,循环n次。在该步中,会根据索引推荐结果里出现的索引列调整所有偏好列的排序,目的是为了以尽量少的探测轮次尽可能准确地探测出索引推荐系统对所有可索引列的偏好排序。此外,还额外对一些偏好性低的列进行稀疏操作来加速探测过程以及提高探测过程的准确性。

14、在s105中,根据探测阶段得到的学习型索引推荐系统的列偏好信息,依概率采样偏好列,生成投毒工作负载。具体为采样偏好列中排名较为次级的次优索引列投入iabart中以生成投毒工作负载,以引导索引推荐系统陷入索引推荐的次优解中而难以跳出。

15、在s106中,将投毒工作负载与正常工作负载混合后注入数据库,以完成对学习型索引推荐系统的投毒。学习型索引推荐系统将会在下一轮更新训练时将会使用混入投毒工作负载的工作负载进行训练更新,投毒工作负载将会有效地将学习型索引推荐系统引导到一个次优解,从而降低学习型索引推荐系统对其他用户的索引推荐性能。

16、与现有技术相比,本专利技术的有益效果如下:

17、(1)本专利技术能够有效地对现有的学习型索引推荐系统进行投毒攻击,大大地降低其索引推荐的效果;

18、(2)本专利技术不仅可以研究获取对多用户数据库进行攻击的手段,还可以通过攻击结果分析现有索引推荐系统在设计细节方面的安全漏洞,从而指导以后更安全稳定的索引推荐系统的设计。

本文档来自技高网...

【技术保护点】

1.一种针对学习型索引推荐系统的投毒攻击方法,其特征在于,包括:

2.根据权利要求1所述的针对学习型索引推荐系统的投毒攻击方法,其特征在于,所述S101中,IABART包含一个双向编码器和一个自回归解码器;

3.根据权利要求1所述的针对学习型索引推荐系统的投毒攻击方法,其特征在于,所述S103中,通过聚合不同工作负载即计算期望来衡量列li的偏好K;K的经验期望通过以下方式计算:

4.根据权利要求1所述的针对学习型索引推荐系统的投毒攻击方法,其特征在于,所述S104,具体包括:

5.根据权利要求4所述的针对学习型索引推荐系统的投毒攻击方法,其特征在于,更新列抽样概率的计算方法如下:

6.根据权利要求1所述的针对学习型索引推荐系统的投毒攻击方法,其特征在于,所述S105,具体包括:

7.根据权利要求1所述的针对学习型索引推荐系统的投毒攻击方法,其特征在于,所述S106,具体为:

8.一种针对学习型索引推荐系统的投毒攻击系统,其特征在于,包括:

9.一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任意一项所述方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述方法的步骤。

...

【技术特征摘要】

1.一种针对学习型索引推荐系统的投毒攻击方法,其特征在于,包括:

2.根据权利要求1所述的针对学习型索引推荐系统的投毒攻击方法,其特征在于,所述s101中,iabart包含一个双向编码器和一个自回归解码器;

3.根据权利要求1所述的针对学习型索引推荐系统的投毒攻击方法,其特征在于,所述s103中,通过聚合不同工作负载即计算期望来衡量列li的偏好k;k的经验期望通过以下方式计算:

4.根据权利要求1所述的针对学习型索引推荐系统的投毒攻击方法,其特征在于,所述s104,具体包括:

5.根据权利要求4所述的针对学习型索引推荐系统的投毒攻击方法,其特征在于,更新列抽样概率的计算方法如下:

...

【专利技术属性】
技术研发人员:林琛
申请(专利权)人:厦门大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1