目录生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39315625 阅读:8 留言:0更新日期:2023-11-12 15:59
本申请实施例公开了一种目录生成方法、装置、电子设备及存储介质,该目录生成方法通过根据目标节点级别,快捷地从目标映射信息中确定目标目录节点对应的目标父节点,进而获取目标网页的目录树列表,根据目标父节点的确定结果将目标目录节点添加至目录树列表中,根据添加目标目录节点后的目录树列表生成目标网页的目标目录,此过程中无须进行字符串的匹配,从而能够有效地提升目录生成的效率,降低设备的内存占用;并且,通过在各个遍历轮次中根据目标目录节点相应更新目标映射信息,在生成目标目录时能够快速确定不同目标目录节点之间的层级关系,从而能够提升目录生成的精细化程度,保持目录生成的准确性,可以广泛应用于云技术领域。技术领域。技术领域。

【技术实现步骤摘要】
目录生成方法、装置、电子设备及存储介质


[0001]本申请涉及计算机
,特别是涉及一种目录生成方法、装置、电子设备及存储介质。

技术介绍

[0002]目录可以用于表征文本的结构性特征,能够满足读者快速寻找内容、实现跳跃性阅读的需求。相关技术中,一般根据目录的特性,采用特定文本匹配的方式来自动生成目录,例如利用“第X章”、“第X节”等常用的特定文本来进行匹配。然而,这种方式需要先将文本转化成字符串,目录的生成效率较低,并且当字符串较长时,会进一步增加目录的生成耗时,增加设备的内存占用。

技术实现思路

[0003]以下是对本申请详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
[0004]本申请实施例提供了一种目录生成方法、装置、电子设备及存储介质,能够提升目录生成的效率,降低设备的内存占用。
[0005]一方面,本申请实施例提供了一种目录生成方法,包括:
[0006]按照目标网页中自上至下的位置顺序遍历所述目标网页的多个内容标题,根据当前遍历轮次中的所述内容标题创建目标目录节点,并确定所述目标目录节点的目标节点级别;
[0007]获取当前遍历轮次中的目标映射信息,其中,所述目标映射信息用于指示节点级别与父节点之间的映射关系;
[0008]根据所述目标节点级别从所述目标映射信息中确定所述目标目录节点对应的目标父节点;
[0009]获取所述目标网页的目录树列表,根据所述目标父节点的确定结果将所述目标目录节点添加至所述目录树列表中,根据所述目标目录节点更新所述目标映射信息;
[0010]根据添加所述目标目录节点后的所述目录树列表生成所述目标网页的目标目录。
[0011]另一方面,本申请实施例还提供了一种目录生成装置,包括:
[0012]节点创建模块,用于按照目标网页中自上至下的位置顺序遍历所述目标网页的多个内容标题,根据当前遍历轮次中的所述内容标题创建目标目录节点,并确定所述目标目录节点的目标节点级别;
[0013]映射信息获取模块,用于获取当前遍历轮次中的目标映射信息,其中,所述目标映射信息用于指示节点级别与父节点之间的映射关系;
[0014]匹配模块,用于根据所述目标节点级别从所述目标映射信息中确定所述目标目录节点对应的目标父节点;
[0015]添加模块,用于获取所述目标网页的目录树列表,根据所述目标父节点的确定结
果将所述目标目录节点添加至所述目录树列表中,根据所述目标目录节点更新所述目标映射信息;
[0016]目录生成模块,用于根据添加所述目标目录节点后的所述目录树列表生成所述目标网页的目标目录。
[0017]进一步,上述添加模块具体用于:
[0018]根据所述目标父节点的确定结果得到所述目标目录节点在所述目录树列表中的写入位置;
[0019]根据所述写入位置将所述目标目录节点添加至所述目录树列表中。
[0020]进一步,上述添加模块具体用于:
[0021]当所述目标父节点的确定结果为所述目标目录节点不存在所述目标父节点,将所述目标目录节点在所述目录树列表中的写入位置确定为所述目录树列表中的末尾位置;
[0022]或者,当所述目标父节点的确定结果为所述目标目录节点存在所述目标父节点,在所述目录树列表中创建所述目标父节点对应的子目录集合,将所述目标目录节点在所述目录树列表中的写入位置确定为所述子目录集合中的末尾位置。
[0023]进一步,上述匹配模块具体用于:
[0024]将所述目标节点级别与所述目标映射信息中的节点级别进行匹配,根据匹配结果从所述目标映射信息中的父节点里确定所述目标目录节点对应的目标父节点;
[0025]或者,将所述目标节点级别降低后与所述目标映射信息中的节点级别进行匹配,根据匹配结果从所述目标映射信息中的父节点里确定所述目标目录节点对应的目标父节点。
[0026]进一步,上述添加模块具体用于:
[0027]根据所述目标节点级别从所述目标映射信息中确定所述目标目录节点对应的待替换节点;
[0028]将所述待替换节点更新为所述目标目录节点,得到更新后的所述目标映射信息。
[0029]进一步,上述添加模块具体用于:
[0030]将所述目标节点级别与所述目标映射信息中的节点级别进行匹配,根据匹配结果从所述目标映射信息中的父节点里确定所述目标目录节点对应的待替换节点;
[0031]或者,将所述目标节点级别提升后与所述目标映射信息中的节点级别进行匹配,根据匹配结果从所述目标映射信息中的父节点里确定所述目标目录节点对应的待替换节点。
[0032]进一步,上述映射信息获取模块具体用于:
[0033]若前一个遍历轮次中的所述目标节点级别为一级,或者前一个遍历轮次中的所述目标节点级别与首个遍历轮次中的所述目标节点级别相同时,获取所述目录树列表,将前一个遍历轮次的所述目标目录节点添加至所述目录树列表中的末尾位置;
[0034]将前一个遍历轮次中的所述目标目录节点与所述目标节点级别之间的映射关系添加至前一个遍历轮次中的目标映射信息,得到当前遍历轮次中的目标映射信息;
[0035]若当前遍历轮次中的所述目标节点级别为二级以上,或者当前遍历轮次中的所述目标节点级别与首个遍历轮次中的所述目标节点级别不相同时,获取当前遍历轮次中的目标映射信息。
[0036]进一步,上述节点创建模块具体用于:
[0037]获取目标网页的网页代码文本;
[0038]根据所述网页代码文本中的元素标签识别所述目标网页中的多个内容标题,根据所述元素标签确定各个所述内容标题的标题级别;
[0039]基于在所述目标网页中自上至下的位置顺序,根据多个所述内容标题以及所述内容标题对应的所述标题级别构建标题列表,遍历所述标题列表。
[0040]进一步,上述节点创建模块具体用于:
[0041]根据当前遍历轮次中的所述内容标题确定节点名称,根据当前遍历轮次中的所述内容标题的所述标题级别确定节点级别;
[0042]根据所述节点名称和所述节点级别创建目标目录节点。
[0043]进一步,上述目录生成模块具体用于:
[0044]对添加所述目标目录节点后的所述目录树列表进行解析,得到多个目录节点链路,其中,所述目录节点链路包括多个所述目标目录节点,任意一个所述目录节点链路的首个目录节点为所述目录节点链路中所述目标节点级别最大的所述目标目录节点;
[0045]根据多个所述目录节点链路生成所述目标网页的目标目录。
[0046]进一步,上述目录生成模块具体用于:
[0047]对添加所述目标目录节点后的所述目录树列表进行解析,得到多个目录节点链路;
[0048]当第一目录节点为所在的所述目录节点链路中所述目标节点级别最小的目录节点,第二目录节点为所在的所述目录节点链路的首个目录节点,且所述第一目录节点的所述目标节点级别大于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目录生成方法,其特征在于,包括:按照目标网页中自上至下的位置顺序遍历所述目标网页的多个内容标题,根据当前遍历轮次中的所述内容标题创建目标目录节点,并确定所述目标目录节点的目标节点级别;获取当前遍历轮次中的目标映射信息,其中,所述目标映射信息用于指示节点级别与父节点之间的映射关系;根据所述目标节点级别从所述目标映射信息中确定所述目标目录节点对应的目标父节点;获取所述目标网页的目录树列表,根据所述目标父节点的确定结果将所述目标目录节点添加至所述目录树列表中,根据所述目标目录节点更新所述目标映射信息;根据添加所述目标目录节点后的所述目录树列表生成所述目标网页的目标目录。2.根据权利要求1所述的目录生成方法,其特征在于,所述根据所述目标父节点的确定结果将所述目标目录节点添加至所述目录树列表中,包括:根据所述目标父节点的确定结果得到所述目标目录节点在所述目录树列表中的写入位置;根据所述写入位置将所述目标目录节点添加至所述目录树列表中。3.根据权利要求2所述的目录生成方法,其特征在于,所述根据所述目标父节点的确定结果得到所述目标目录节点在所述目录树列表中的写入位置,包括:当所述目标父节点的确定结果为所述目标目录节点不存在所述目标父节点,将所述目标目录节点在所述目录树列表中的写入位置确定为所述目录树列表中的末尾位置;或者,当所述目标父节点的确定结果为所述目标目录节点存在所述目标父节点,在所述目录树列表中创建所述目标父节点对应的子目录集合,将所述目标目录节点在所述目录树列表中的写入位置确定为所述子目录集合中的末尾位置。4.根据权利要求1所述的目录生成方法,其特征在于,所述根据所述目标节点级别从所述目标映射信息中确定所述目标目录节点对应的目标父节点,包括:将所述目标节点级别与所述目标映射信息中的节点级别进行匹配,根据匹配结果从所述目标映射信息中的父节点里确定所述目标目录节点对应的目标父节点;或者,将所述目标节点级别降低后与所述目标映射信息中的节点级别进行匹配,根据匹配结果从所述目标映射信息中的父节点里确定所述目标目录节点对应的目标父节点。5.根据权利要求1所述的目录生成方法,其特征在于,所述根据所述目标目录节点更新所述目标映射信息,包括:根据所述目标节点级别从所述目标映射信息中确定所述目标目录节点对应的待替换节点;将所述待替换节点更新为所述目标目录节点,得到更新后的所述目标映射信息。6.根据权利要求5所述的目录生成方法,其特征在于,所述根据所述目标节点级别从所述目标映射信息中确定所述目标目录节点对应的待替换节点,包括:将所述目标节点级别与所述目标映射信息中的节点级别进行匹配,根据匹配结果从所述目标映射信息中的父节点里确定所述目标目录节点对应的待替换节点;或者,将所述目标节点级别提升后与所述目标映射信息中的节点级别进行匹配,根据匹配结果从所述目标映射信息中的父节点里确定所述目标目录节点对应的待替换节点。
7.根据权利要求1所述的目录生成方法,其特征在于,所述获取当前遍历轮次中的目标映射信息,包括:若前一个遍历轮次中的所述目标节点级别为一级,或者前一个遍历轮次中的所述目标节点级别与首个遍历轮次中的所述目标节点级别相同时,获取所述目录树列表,将前一个遍历轮次的所述目标目录节点添加至所述目录树列表中的末尾位置,将前一个遍历轮次中的所述目标目录节点与所述目标节点级别之间的映射关系添加至前一个遍历轮次中的目标映射信息,得到当前遍历轮次中的目标映射信息;若当前遍历轮次中的所述目标节点级别为二级以上,或者当前遍历轮次中的所述目标节点级别与首个遍历轮次中的所述目标节点级别不相同时,获取当前遍历轮次中的目标映射信息。8.根据权利要求1所述的目录生成方法,其特征在于,所述按照目标网页中自上至下的位置顺序遍历所述目标网页的多个内容标题,包括:获取目标网页的网页代码文本;根据所述网页代...

【专利技术属性】
技术研发人员:胡福星
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1