文本内容获取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:42235543 阅读:22 留言:0更新日期:2024-08-02 13:49
本公开涉及计算机技术领域,尤其涉及信息技术、网络安全等技术领域,具体涉及一种文本内容获取方法、装置、电子设备及存储介质。具体实现方案:对测评文档进行拆分,得到多个第一测评文本块;利用文本嵌入模型,对多个第一测评文本块中的每个第一测评文本块进行向量化处理,得到多个文本块描述向量;利用文本嵌入模型,对目标测评项的项目描述信息进行向量化处理,得到测评项描述向量;基于多个文本块描述向量中每个文本块描述向量与测评项描述向量的相关度,从多个第一测评文本块中选取第一目标文本块;基于第一目标文本块,得到与目标测评项相关的目标文本内容。采用本公开可以提高目标文本内容的获取效率和可靠性。

【技术实现步骤摘要】

本公开涉及计算机,尤其涉及信息技术、网络安全等,具体涉及一种文本内容获取方法、装置、电子设备及存储介质


技术介绍

1、随着信息技术的迅猛进步,网络安全问题日益凸显。基于此,网络安全等级保护应运而生,这是一套旨在保护关键信息基础设施安全的标准化措施。而网络安全等级保护测评(后称,等保测评),则是对信息系统进行全面深入的安全性检查与评估。目前,等保测评通常是由工作人员人工对测评文档进行分析,得到与目标测评项相关的目标文本内容,以便基于与目标测评项相关的目标文本内容,对信息系统进行等保测评,得到与目标测评项相关的等保测评结果。

2、然而,由工作人员人工对测评文档进行分析,得到与目标测评项相关的目标文本内容不仅耗时耗力,还对工作人员的专业知识、工作经验和工作状态有极高要求,因此,无法确保目标文本内容的获取效率和可靠性。


技术实现思路

1、本公开提供了一种文本内容获取方法、装置、电子设备及存储介质。

2、根据本公开的一方面,提供了一种文本内容获取方法,包括:

3、对测评文档进行拆分本文档来自技高网...

【技术保护点】

1.一种文本内容获取方法,包括:

2.根据权利要求1所述的方法,其中,所述对测评文档进行拆分,得到多个第一测评文本块,包括:

3.根据权利要求2所述的方法,其中,所述基于所述多个初始文本块中每个初始文本块的文本长度,对所述多个初始文本块进行处理,得到多个第一测评文本块,包括:

4.根据权利要求3所述的方法,其中,所述基于所述待拆文本块,得到第一测评文本块,包括:

5.根据权利要求1所述的方法,其中,所述基于所述多个文本块描述向量中每个文本块描述向量与所述测评项描述向量的相关度,从所述多个第一测评文本块中选取第一目标文本块,包括:

...

【技术特征摘要】

1.一种文本内容获取方法,包括:

2.根据权利要求1所述的方法,其中,所述对测评文档进行拆分,得到多个第一测评文本块,包括:

3.根据权利要求2所述的方法,其中,所述基于所述多个初始文本块中每个初始文本块的文本长度,对所述多个初始文本块进行处理,得到多个第一测评文本块,包括:

4.根据权利要求3所述的方法,其中,所述基于所述待拆文本块,得到第一测评文本块,包括:

5.根据权利要求1所述的方法,其中,所述基于所述多个文本块描述向量中每个文本块描述向量与所述测评项描述向量的相关度,从所述多个第一测评文本块中选取第一目标文本块,包括:

6.根据权利要求1或5所述的方法,所述基于所述多个文本块描述向量中每个文本块描述向量与所述测评项描述向量的相关度,从所述多个第一测评文本块中选取第一目标文本块之前,所述方法还包括:

7.根据权利要求1或5所述的方法,所述基于所述多个文本块描述向量中每个文本块描述向量与所述测评项描述向量的相关度,从所述多个第一测评文本块中选取第一目标文本块之前,所述方法还包括:

8.根据权利要求7所述的方法,其中,所述基于所述第一测评文本块对所述测评关键字的覆盖程度,调整与所述第一测评文本块对应的文本块描述向量与所述测评项描述向量的相关度,包括:

9.根据权利要求1所述的方法,所述利用所述文本嵌入模型,对目标测评项的项目描述...

【专利技术属性】
技术研发人员:曹培治杜悦艺张丽
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1