System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 关键词高亮标注方法、装置、计算机设备及存储介质制造方法及图纸_技高网

关键词高亮标注方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:40557612 阅读:11 留言:0更新日期:2024-03-05 19:19
本发明专利技术涉及文本处理技术领域,具体公开了一种关键词高亮标注方法。该方法包括:通过AC自动机对获取的各待处理文本进行关键词位置标注,以获取到各目标关键词在每个待处理文本中的文本位置;基于颜色设置模块对所有目标关键词进行颜色分配,得到颜色分配结果;根据所有高亮颜色分配结果,通过数据分析模块对待处理文本中的目标关键词同时进行高亮颜色标注,得到包括高亮标注结果的目标文本。本发明专利技术通过AC自动机进行关键词位置标注,实现了关键词位置的精准确定。通过数据分析模块进行高亮颜色标注,实现了所有文本中关键词同时高亮标注,提高了关键词高亮标注的效率,进而实现了快速过滤数据,凸显关键信息,提高数据分析的效率。

【技术实现步骤摘要】

本专利技术涉及文本处理,尤其涉及一种关键词高亮标注方法、装置、计算机设备及存储介质


技术介绍

1、随着互联网时代,信息爆炸式地增长,高亮关键词对于数据处理和数据分析至关重要。高亮关键词有助于错误检查,更容易发现拼写错误、异常值或逻辑问题。此外,在文档编辑和报告创建中,高亮关键词可以使文本更加清晰,以及更容易理解复杂的信息。

2、现有技术中的关键词高亮标注方法,主要是基于在设置完成的颜色框中一个一个的输入需要高亮标注的关键词,如此,可以对单个文本中的多个关键词进行高亮标注。但是,该方式对多个文本中的多个关键词,需要分别处理,因此需要耗费大量的时间对所有文本进行关键词高亮标注,导致关键词高亮标注的效率较低。因而,如何提高关键词高亮标注的效率是亟待解决的问题。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种关键词高亮标注方法、装置、计算机设备及存储介质,以解决现有技术中关键词高亮标注效率较低的问题。

2、一种关键词高亮标注方法,包括:

3、获取至少一个待处理文本,所述待处理文本中包括至少一个目标关键词;

4、通过ac自动机对各所述待处理文本进行关键词位置标注,以获取到各所述目标关键词在每个所述待处理文本中的文本位置;

5、基于颜色设置模块对所有所述文本位置上的目标关键词进行颜色分配,得到与各所述目标关键词一一对应且不同的高亮颜色分配结果;

6、根据所有所述高亮颜色分配结果,通过数据分析模块对所述待处理文本中的所有所述文本位置上的目标关键词同时进行高亮颜色标注,得到包括高亮标注结果的目标文本;所述高亮标注结果包括分别根据一一对应的所述高亮颜色分配结果完成高亮颜色标注后的所有所述目标关键词。

7、一种关键词高亮标注装置,包括:

8、获取文本模块,用于获取至少一个待处理文本,所述待处理文本中包括至少一个目标关键词;

9、位置标注模块,用于通过ac自动机对各所述待处理文本进行关键词位置标注,以获取到各所述目标关键词在每个所述待处理文本中的文本位置;

10、颜色分配模块,用于基于颜色设置模块对所有所述文本位置上的目标关键词进行颜色分配,得到与各所述目标关键词一一对应且不同的高亮颜色分配结果;

11、高亮标注模块,用于根据所有所述高亮颜色分配结果,通过数据分析模块对所述待处理文本中的所有所述文本位置上的目标关键词同时进行高亮颜色标注,得到包括高亮标注结果的目标文本;所述高亮标注结果包括分别根据一一对应的所述高亮颜色分配结果完成高亮颜色标注后的所有所述目标关键词。

12、一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述关键词高亮标注方法。

13、一个或多个存储有计算机可读指令的可读存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行上述关键词高亮标注方法。

14、上述关键词高亮标注方法、装置、计算机设备及存储介质,本专利技术通过ac自动机对各待处理文本进行关键词位置标注,实现了目标关键词在每个待处理文本中的文本位置的确定,进而实现了对目标关键词的精准定位,提高了文本处理的速度。基于颜色设置模块对所有目标关键词进行颜色分配,实现了对颜色分配结果的确定,进而实现了对不同关键词的颜色自定义设置。通过数据分析模块对待处理文本中的所有文本位置上的目标关键词同时进行高亮颜色标注,实现了对高亮标注结果的确定,以及实现了对目标关键词的批处理,提高了关键词高亮标注的效率,进而实现了快速过滤数据,凸显关键信息,提高数据分析的效率。

本文档来自技高网...

【技术保护点】

1.一种关键词高亮标注方法,其特征在于,包括:

2.如权利要求1所述的关键词高亮标注方法,其特征在于,所述通过AC自动机对各所述待处理文本进行关键词位置标注,以获取到各所述目标关键词在每个所述待处理文本中的文本位置之前,包括:

3.如权利要求2所述的关键词高亮标注方法,其特征在于,所述通过AC自动机对各所述待处理文本进行关键词位置标注,以获取到各所述目标关键词在所述待处理文本中的文本位置,包括:

4.如权利要求3所述的关键词高亮标注方法,其特征在于,所述基于所述字典树和所述失配指针对所有所述待处理文本进行关键词查询,得到与各所述待处理文本对应的目标关键词,还包括:

5.如权利要求4所述的关键词高亮标注方法,其特征在于,所述从所述字典树中根据预设选取规则选取一个预设关键词的第一子节点对所述待处理文本进行内容匹配之后,还包括:

6.如权利要求4或5所述的关键词高亮标注方法,其特征在于,所述判断所述预设关键词的所有子节点是否均已与所述待处理文本匹配成功之后,还包括:

7.如权利要求2所述的关键词高亮标注方法,其特征在于,所述基于颜色设置模块对所有所述文本位置上的目标关键词进行颜色分配,得到与各所述目标关键词一一对应且不同的高亮颜色分配结果,包括:

8.一种关键词高亮标注装置,其特征在于,包括:

9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如权利要求1至7任一项所述关键词高亮标注方法。

10.一个或多个存储有计算机可读指令的可读存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1至7中任一项所述关键词高亮标注方法。

...

【技术特征摘要】

1.一种关键词高亮标注方法,其特征在于,包括:

2.如权利要求1所述的关键词高亮标注方法,其特征在于,所述通过ac自动机对各所述待处理文本进行关键词位置标注,以获取到各所述目标关键词在每个所述待处理文本中的文本位置之前,包括:

3.如权利要求2所述的关键词高亮标注方法,其特征在于,所述通过ac自动机对各所述待处理文本进行关键词位置标注,以获取到各所述目标关键词在所述待处理文本中的文本位置,包括:

4.如权利要求3所述的关键词高亮标注方法,其特征在于,所述基于所述字典树和所述失配指针对所有所述待处理文本进行关键词查询,得到与各所述待处理文本对应的目标关键词,还包括:

5.如权利要求4所述的关键词高亮标注方法,其特征在于,所述从所述字典树中根据预设选取规则选取一个预设关键词的第一子节点对所述待处理文本进行内容匹配之后,还包括:

6....

【专利技术属性】
技术研发人员:陈杰刘杨林跃卢品吟李运洋
申请(专利权)人:深圳市东信云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1