对话文本分析结果定位与高亮实现方法技术

技术编号:39511560 阅读:9 留言:0更新日期:2023-11-25 18:47
本申请涉及数据安全相关技术领域,具体涉及一种对话文本分析结果定位与高亮实现方法

【技术实现步骤摘要】
对话文本分析结果定位与高亮实现方法


[0001]本申请涉及文本处理相关
,具体涉及一种对话文本分析结果定位与高亮实现方法


技术介绍

[0002]对话文本分析结果存储采用的是链表数据结构,这种结构简单,搜索时需要循环读取链表内每一个对象,再进行相应判断是否符合,这就使得搜索效率不高;对话文本角色一般会包括客户

客服
/
业务员,但如果是在线的场景会有机器人,这对分析结果定位就比较困难,需要对角色进行拆分,而且角色也会随着业务的发展而变化;分析结果的位置仅针对整个对话文本,若需定位至某一段对话,则需额外的操作;而高亮则为简单地处理,容易存在重叠


技术实现思路

[0003]有鉴于此,本申请的实施例致力于提供一种对话文本分析结果定位与高亮实现方法

[0004]本申请第一方面提供了一种对话文本分析结果定位与高亮实现方法,包括:
[0005]获取对话文本的分析结果;其中所述分析结构包括对话文本

对话文本中的目标字段和所述目标字段对应的位置;
[0006]采用红黑树数据结构存储所述分析结果;
[0007]在存储所述分析结果中,检索存在重叠的关系的目标字段;
[0008]合并相互重叠的目标字段为一个目标字段;
[0009]显示所述对话文本,并对所述对话文本中的目标字段进行高亮显示

[0010]在一些实施例中,所述采用红黑树数据结构存储所述分析结果,包括:
[0011]将对话文本按照角色对话顺序划分为多个子段落;
[0012]对每一子段落中的每一个目标字段的前侧添加一个前侧标识,对每一子段落中的每一个目标字段的后侧添加一个后侧标识;
[0013]采用红黑树数据结构存储各个子段落

[0014]在一些实施例中,在存储所述分析结果中,检索存在重叠的关系的目标字段;
[0015]在存储所述分析结果中,检索两个前侧标识之间不存在后侧标识的情况;
[0016]在同一子段落若存在两个前侧标识之间不存在后侧标识,则该前侧标识分别对应的目标字段为存在重叠的关系的目标字段

[0017]在一些实施例中,所述合并相互重叠的目标字段为一个目标字段,包括:
[0018]若存在两个前侧标识之间不存在后侧标识,则删除两个前侧标识中靠后的前侧标识;
[0019]若存在两个后侧标识之间不存在前侧标识,则删除后个前侧标识中靠前的后侧标识;
[0020]两个前侧标识中剩余的前侧标识和两个后侧标识剩余的后侧标识之间的子段为目标字段

[0021]在一些实施例中,所述合并相互重叠的目标字段为一个目标字段,包括:
[0022]针对每一个目标字段,生成一个表示所述目标字段的二维数组;
[0023]其中,所述二维数组中第一个数字表示所述目标字段中第一个字在子段落的排序;所述二维数组中第二个数字表示所述目标字段中最后一个字在子段落的排序;
[0024]选取相互重叠目标字段的二维数组中的最小数字作为第一个目标数字;
[0025]选取相互重叠目标字段的二维数组中的最大数字作为第二个目标数字;
[0026]基于第一个目标数字在前第二个目标数字在后的方式,生成一个新的二维数组;
[0027]其中,新的二维数组表示合并相互重叠的目标字段得到的目标字段的位置

本申请所提供的一种对话文本分析结果定位与高亮实现方法,首先获取对话文本的分析结果;其中所述分析结构包括对话文本

对话文本中的目标字段和所述目标字段对应的位置;采用红黑树数据结构存储所述分析结果;在存储所述分析结果中,检索存在重叠的关系的目标字段;合并相互重叠的目标字段为一个目标字段;显示所述对话文本,并对所述对话文本中的目标字段进行高亮显示

如此设置,将重叠的目标字段合并为一个目标字段,避免在高亮显示目标字段的过程中,因为目标字段重叠而显示错误

附图说明
[0028]通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的

特征和优势将变得更加明显

附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制

在附图中,相同的参考标号通常代表相同部件或步骤

[0029]图1是本申请一个实施例提供的对话文本分析结果定位与高亮实现方法的流程示意图

具体实施方式
[0030]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例

基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围

[0031]申请概述
[0032]对话文本分析结果存储采用的是链表数据结构,这种结构简单,搜索时需要循环读取链表内每一个对象,再进行相应判断是否符合,这就使得搜索效率不高;对话文本角色一般会包括客户

客服
/
业务员,但如果是在线的场景会有机器人,这对分析结果定位就比较困难,需要对角色进行拆分,而且角色也会随着业务的发展而变化;分析结果的位置仅针对整个对话文本,若需定位至某一段对话,则需额外的操作;而高亮则为简单地处理,容易存在重叠

[0033]为了解决上述问题,本申请提供一种方案包括:获取对话文本的分析结果;其中所述分析结构包括对话文本

对话文本中的目标字段和所述目标字段对应的位置;采用红黑
树数据结构存储所述分析结果;在存储所述分析结果中,检索存在重叠的关系的目标字段;合并相互重叠的目标字段为一个目标字段;显示所述对话文本,并对所述对话文本中的目标字段进行高亮显示

如此,将重叠的目标字段合并为一个目标字段,避免在高亮显示目标字段的过程中,因为目标字段重叠而显示错误

[0034]在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例

[0035]图1是本申请一个实施例提供的对话文本分析结果定位与高亮实现方法的流程示意图

如图1所示,该方法包括如下内容

[0036]步骤
S110
,获取对话文本的分析结果;其中所述分析结构包括对话文本

对话文本中的目标字段和所述目标字段对应的位置;
[0037]需要说明的是,在实际应用中获取的一般为音频数据,对音频数据进行处理可以得到对话文本,通过查找的方式或其他字符匹配的方式可以获得对话文本中的目本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种对话文本分析结果定位与高亮实现方法,其特征在于,包括:获取对话文本的分析结果;其中所述分析结构包括对话文本

对话文本中的目标字段和所述目标字段对应的位置;采用红黑树数据结构存储所述分析结果;在存储所述分析结果中,检索存在重叠的关系的目标字段;合并相互重叠的目标字段为一个目标字段;显示所述对话文本,并对所述对话文本中的目标字段进行高亮显示
。2.
根据权利要求1所述的对话文本分析结果定位与高亮实现方法,其特征在于,所述采用红黑树数据结构存储所述分析结果,包括:将对话文本按照角色对话顺序划分为多个子段落;对每一子段落中的每一个目标字段的前侧添加一个前侧标识,对每一子段落中的每一个目标字段的后侧添加一个后侧标识;采用红黑树数据结构存储各个子段落
。3.
根据权利要求2所述的对话文本分析结果定位与高亮实现方法,其特征在于,在存储所述分析结果中,检索存在重叠的关系的目标字段;在存储所述分析结果中,检索两个前侧标识之间不存在后侧标识的情况;在同一子段落若存在两个前侧标识之间不存在后侧标识,则该前侧标识分别对应的目标字段为存在重...

【专利技术属性】
技术研发人员:戎小海
申请(专利权)人:上海中通吉网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1