检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26377054 阅读:37 留言:0更新日期:2020-11-19 23:45
本申请提供一种检测方法、装置、电子设备及存储介质,包括:获取待测文本;基于预定关键字段,从所述待测文本中提取出与所述预定关键字段对应的关键文本信息;从所述待测文本中,提取出与所述关键文本信息相关的特征语句;将所述特征语句输入至预先训练好的检测模型中,得到表征所述待测文本是否被篡改的结果,与利用完整的待测文本来进行篡改检测相比,极大地降低检测复杂度;其次,由于若一个文本被篡改,那么与该文本的关键字段相关的语句通常会包括篡改后的信息,因此,利用特征语句能够准确地检测出待测文本是否被篡改。

【技术实现步骤摘要】
检测方法、装置、电子设备及存储介质
本申请涉及网络安全
,具体而言,涉及一种检测方法、装置、电子设备及存储介质。
技术介绍
我们正处于一个数字经济化时代,不论是刚刚起步或发展的中小企业,还是已经有了丰富资金经济脉络的大型企业,都需要建立自己的网站。网站已成为企事业单位的形象窗口,也是对外开展业务、提供服务的重要手段。如果网站的网页内容被恶意篡改,不仅会影响正常业务的开展,而且还会对企业形象带来极其不好的影响。基于此,现有技术提出通过模拟在浏览器地址栏中输入统一资源定位符URL的方式,发起访问目标网页的请求,并将得到的页面内容确定为第一页面内容,并通过模拟链接跳转的方式,发起访问所述目标网页的请求,并将得到的页面内容确定为第二页面内容,继而通过比较所述第一页面内容与第二页面内容,得到一比较结果,最后根据所述比较结果识别所述目标网页是否为被篡改网页。然而,现有技术使用页面的全部内容进行检测,势必存在检测复杂度过大的问题。
技术实现思路
鉴于此,本申请实施例的目的在于提供一种检测方法、装置、电子设备及存储介质,以较低本文档来自技高网...

【技术保护点】
1.一种检测方法,其特征在于,所述方法包括:/n获取待测文本;/n基于预定关键字段,从所述待测文本中提取出与所述预定关键字段对应的关键文本信息;/n从所述待测文本中,提取出与所述关键文本信息相关的特征语句;/n将所述特征语句输入至预先训练好的检测模型中,得到表征所述待测文本是否被篡改的结果。/n

【技术特征摘要】
1.一种检测方法,其特征在于,所述方法包括:
获取待测文本;
基于预定关键字段,从所述待测文本中提取出与所述预定关键字段对应的关键文本信息;
从所述待测文本中,提取出与所述关键文本信息相关的特征语句;
将所述特征语句输入至预先训练好的检测模型中,得到表征所述待测文本是否被篡改的结果。


2.根据权利要求1所述的方法,其特征在于,所述从所述待测文本中,提取出与所述关键文本信息相关的特征语句,包括:
对所述待测文本进行分句处理,得到多个语句;
针对所述多个语句中的每个语句,确定该语句与所述关键文本信息的相关性;
从所述多个语句中,提取出相关性大于预设值的特征语句。


3.根据权利要求2所述的方法,其特征在于,所述从所述多个语句中,提取出相关性大于预设值的特征语句,包括:
从所述多个语句中,提取出相关性大于预设值的多条待选特征语句;
根据相关性大小,按照从大到小的顺序对所述多条待选特征语句进行排序;
根据排序结果,从所述多条待选特征语句中确定出相关性排序位于前预设位的至少两条特征语句。


4.根据权利要求1所述的方法,其特征在于,所述将所述特征语句输入至预先训练好的检测模型中,得到表征所述待测文本是否被篡改的结果,包括:
将所述特征语句和所述关键文本信息输入至所述检测模型中,得到表征所述待测文本是否被篡改的结果。


5.根据权利要求1所述的方法,其特征在于,若所述特征语句的数量为至少两条;所述将所述特征语句输入至预先训练好的检测模型中,得到表征所述待测的文本是否被篡改的结果,包括:
根据相关性的大小,按照从大到小的顺序对至少两条所述特征语句进行排序,得到一条排序后的语句;
...

【专利技术属性】
技术研发人员:潘季明姚剑文
申请(专利权)人:北京天融信网络安全技术有限公司北京天融信科技有限公司北京天融信软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1