一种网安竞赛作弊检测方法及系统技术方案

技术编号:36765601 阅读:54 留言:0更新日期:2023-03-08 21:20
本发明专利技术公开了一种网安竞赛作弊检测方法及系统。本方法为:1)提取网安竞赛参赛队伍提交的每一WriteUp文档中的图像内容和文本内容;2)计算参赛队伍间提交的WriteUp文档中的图像内容的相似程度;3)如果图像内容相似度大于设定图像相似度阈值,则初步判定参赛队伍间存在作弊行为;4)计算参赛队伍间提交的WriteUp文档中文本内容的相似程度;如果文本内容相似度大于设定文本内容相似度阈值,则初步判定参赛队伍间存在作弊行为;5)根据两网安竞赛参赛队伍提交的WriteUp文档中图像内容相似度和文本内容相似度,确定两网安竞赛参赛队伍是否存在作弊行为。本发明专利技术极大地提高了WriteUp审核的效率和准确性。WriteUp审核的效率和准确性。WriteUp审核的效率和准确性。

【技术实现步骤摘要】
一种网安竞赛作弊检测方法及系统


[0001]本专利技术属于网络空间安全领域,涉及针对网络空间安全人才(以下简称网安人才)能力 评估过程中的作弊行为检测,更具体地,是一种基于WriteUp(网安竞赛中提交的赛题的解 题过程文档)图文内容分析的网安竞赛作弊检测方法及系统,用于准确地识别出网安竞赛中 存在的作弊行为。

技术介绍

[0002]网安人才能力评估是网安人才培养的重要组成部分,其中,反作弊对于网安人才能力评 估来说非常重要,是确保公平竞争、遴选真正人才的基础保障。网安竞赛已成为网安人才培 养和选拔的重要渠道,也是评价网安人才专业技能能力的重要依据。在网安竞赛中,通常在 赛前、赛中、赛后的各个阶段实施作弊审查。赛前,主要通过实名制报名及现场身份核验, 确保本单位人员参赛;赛中,通过动态Flag机制、或设置答案不可能雷同的题目及举报等多 种手段防止参赛队伍作弊;赛后,通过参赛选手提交已解答题目的WriteUp,由人工审核参 赛队伍是否存在作弊行为。WriteUp记录着竞赛中参赛选手答出的赛题的解题过程,网安竞 赛一般要求参赛队伍赛后在有限时间内提交WriteUp。在赛中实施的反作弊审查存在着一定 的漏报,尤其是针对解题模式的赛事。据CTFTIME统计,2020年解题模式的赛题占比为 88.26%。赛事组委会通常在赛中反作弊审查情况的基础上,结合赛后参赛队伍提交的WriteUp 进行交叉验证,最终来判定参赛队伍是否存在作弊行为。目前WriteUp的审核主要由人工来 完成,人工审核耗时而且准确性存在一定的误差。而且鉴于人工审核的限制,目前绝大多数 的网安竞赛要求排名靠前的少数参赛队伍提交WriteUp,由初赛进入总决赛的参赛队伍较少。 参赛选手通过参加网安竞赛可以提升专业技能水平,赛事组委会通过网安竞赛也可以更好地 培养和挖掘网安人才,缓解各行业领域网安人才的短缺状态。如果WriteUp的审核能实现自 动审核,扩大参赛人员范围,这将具有非常重要的现实意义。

技术实现思路

[0003][0004]为解决上述在网安竞赛中网安人才培养和选拔过程中存在的作弊问题,本专利技术提出了一 种基于WriteUp图文内容分析的网安竞赛作弊检测方法及系统,该方法可自动地检测出存在 的作弊行为,人工可进一步审查确认检测结果,极大地提高了WriteUp审核的效率和准确性。 本专利技术从图像内容相似性和文本内容相似性两个维度检测网安竞赛中可能存在的作弊行为; 其中在图像相似性计算方面,采用基于均值哈希的相似性计算、基于直方图的相似性计算、 基于图像长宽比的相似性计算三种算法对图像内容进行相似性对比;在文本相似性计算方面, 从词频相似性和词语转移概率相似性两个方面对文本内容进行相似性对比。同时,根据Flag 提交时间可对作弊源头进行追溯。这里提出的作弊检测方法也可适用于其他网安人才能力评 估方法。
[0005]本专利技术的技术方案为:
[0006]一种网安竞赛作弊检测方法,其步骤包括:
[0007]1)预处理模块收集网安竞赛参赛队伍提交的解题过程文档WriteUp,然后提取每一 WriteUp文档中的图像内容和文本内容;
[0008]2)图像相似性计算模块计算参赛队伍间提交的WriteUp文档中的图像内容的相似程度;
[0009]3)如果参赛队伍间提交的WriteUp中的图像内容相似度大于设定图像相似度阈值,则初 步判定参赛队伍间存在作弊行为;
[0010]4)文本相似性计算模块计算参赛队伍间提交的WriteUp文档中文本内容的相似程度;如 果参赛队伍间提交的WriteUp中的文本内容相似度大于设定文本内容相似度阈值,则 初步判定参赛队伍间存在作弊行为;
[0011]5)作弊行为检测模块根据初步判定存在作弊行为的两网安竞赛参赛队伍提交的WriteUp 文档中图像内容相似度和文本内容相似度,确定两网安竞赛参赛队伍是否存在作弊行 为。
[0012]进一步的,所述预处理模块以参赛队伍为单位提取WriteUp中的图像内容,以赛题为单 位提取WriteUp中的文本内容。
[0013]进一步的,图像相似性计算模块包括基于均值哈希的相似性计算子模块、基于直方图的 相似性计算子模块、基于图像长宽比的图像相似性计算子模块及图像相似性计算子模块;首 先基于均值哈希的相似性计算子模块计算参赛队伍间图像内容的相似度α、基于直方图的相 似性计算子模块计算参赛队伍间图像内容的相似度β、基于图像长宽比的图像相似性计算子 模块计算参赛队伍间图像内容的相似度λ;如果相似度α大于图像相似度阈值α0、相似度β大 于图像相似度阈值β0且相似度λ大于图像相似度阈值λ0,则图像相似性计算子模块判断参赛 队伍间图像内容相似,初步判定对应的参赛队伍间存在作弊行为。
[0014]进一步的,基于均值哈希的相似性计算子模块首先对每张图像生成一图像指纹,然后计 算两图像间图像指纹的汉明距离,得到两图像间的相似度α。
[0015]进一步的,基于直方图的相似性计算子模块首先计算图像的直方图并对其进行归一化, 然后对归一化结果进行相似度度量,得到图像间的相似度β。
[0016]进一步的,基于图像长宽比的相似性计算子模块首先计算两图像中每一图像的长宽比值, 然后计算两图像的长宽比值之差的绝对值,将1减该绝对值作为相似度λ。
[0017]进一步的,所述文本相似性计算模块包括基于词频统计的相似性计算子模块、基于词语 转移概率的相似性计算子模块和基于文本相似性计算子模块共三个子模块;其中,基于词频 统计的相似性计算子模块首先采用独热编码对文本进行向量表示,然后采用杰卡德距离计算 词频的相似度σ;基于词语转移概率的相似性计算子模块首先采用马尔科夫模型来表示词语 间的转移情况,然后采用欧式距离的相似度度量算法计算词语转移概率的相似度θ;基于文 本相似性计算子模块对相似度σ和相似度θ进行加权求和,得到参赛队伍间每道题目文本内 容相似度。
[0018]进一步的,作弊行为检测模块对步骤3)初步判定存在作弊行为的参赛队伍与步骤4)初 步判定存在作弊行为的参赛队伍取并集,即如果参赛队伍间存在图像内容相似度大于设定的 图像相似度阈值或者文本内容相似度大于设定的文本相似度阈值,则判定相应的参赛队伍就 存在作弊行为。
[0019]一种网安竞赛作弊检测系统,其特征在于,包括预处理模块、图像相似性计算模块、文 本相似性计算模块和作弊行为检测模块;其中,
[0020]所述预处理模块,用于收集网安竞赛参赛队伍提交的解题过程文档WriteUp,然后提取 每一WriteUp文档中的图像内容和文本内容;
[0021]所述图像相似性计算模块,用于计算参赛队伍间提交的WriteUp文档中图像内容的相似 程度;如果参赛队伍间提交的WriteUp中的图像内容相似度大于设定图像内容相似度阈值, 则初步判定参赛队伍间存在作弊行为;
[0022]所述文本相似性计算模块,用于计算参赛队伍间提交的WriteUp文档中文本内容的相似 程度;如果参赛队伍间提交的W本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网安竞赛作弊检测方法,其步骤包括:1)预处理模块收集网安竞赛参赛队伍提交的解题过程文档WriteUp,然后提取每一WriteUp文档中的图像内容和文本内容;2)图像相似性计算模块计算参赛队伍间提交的WriteUp文档中的图像内容的相似程度;3)如果参赛队伍间提交的WriteUp中的图像内容相似度大于设定图像相似度阈值,则初步判定参赛队伍间存在作弊行为;4)文本相似性计算模块计算参赛队伍间提交的WriteUp文档中文本内容的相似程度;如果参赛队伍间提交的WriteUp中的文本内容相似度大于设定文本内容相似度阈值,则初步判定参赛队伍间存在作弊行为;5)作弊行为检测模块根据初步判定存在作弊行为的两网安竞赛参赛队伍提交的WriteUp文档中图像内容相似度和文本内容相似度,确定两网安竞赛参赛队伍是否存在作弊行为。2.如权利要求1所述的方法,其特征在于,所述预处理模块以参赛队伍为单位提取WriteUp中的图像内容,以赛题为单位提取WriteUp中的文本内容。3.如权利要求1或2所述的方法,其特征在于,图像相似性计算模块包括基于均值哈希的相似性计算子模块、基于直方图的相似性计算子模块、基于图像长宽比的图像相似性计算子模块及图像相似性计算子模块;首先基于均值哈希的相似性计算子模块计算参赛队伍间图像内容的相似度α、基于直方图的相似性计算子模块计算参赛队伍间图像内容的相似度β、基于图像长宽比的图像相似性计算子模块计算参赛队伍间图像内容的相似度λ;如果相似度α大于图像相似度阈值α0、相似度β大于图像相似度阈值β0且相似度λ大于图像相似度阈值λ0,则图像相似性计算子模块判断两参赛队伍间图像内容相似,初步判定对应的参赛队伍间存在作弊行为。4.如权利要求3所述的方法,其特征在于,基于均值哈希的相似性计算子模块首先对每张图像生成一图像指纹,然后计算两图像间图像指纹的汉明距离,得到两图像间的相似度α。5.如权利要求3所述的方法,其特征在于,基于直方图的相似性计算子模块首先计算图像的直方图并对其进行归一化,然后对归一化结果进行相似度度量,得到图像间的相似度β。6.如权利要求3所述的方法,其特征在于,基于图像长宽比的相似性计算子模块首先计算两图像中每一图像的长宽比值,然后计算两图像的长宽比值之差的绝对值,将1减该绝对值作为相似度λ。7.如权利要求1所述的方法,其特征在于,所述文本相似性计算模块包括基于词频统计的相似性计算子模块、基于词汇转移概率的...

【专利技术属性】
技术研发人员:张方娇刘潮歌刘奇旭崔翔
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1