一种选择方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:27539186 阅读:21 留言:0更新日期:2021-03-03 11:31
本发明专利技术实施例公开了一种选择方法、装置、计算机设备及其储存介质。该方法包括构建文本的文本数据结构,并建立与文本数据结构对应的光标数据结构;接收用户给定的起点坐标和终点坐标,在文本数据结构中寻找起点坐标的位置和终点坐标的位置,并在光标数据结构中分别匹配出对应的起点光标位置和终点光标位置;根据起点光标位置和终点光标位置确定文本范围,并对文本范围内的文本内容进行选择。本发明专利技术实施例通过提供的起点坐标和终点坐标,计算文本数据结构中被选中的区域,具有文本内容选择准确高,便于后续进行标注的优点。便于后续进行标注的优点。便于后续进行标注的优点。

【技术实现步骤摘要】
一种选择方法、装置、计算机设备及存储介质


[0001]本专利技术实施例涉及文本处理
,尤其涉及一种选择方法、装置、计算机设备及存储介质。

技术介绍

[0002]目前,常用的版式文档有流式文档和固定版式文档;固定版式文档的页面内容在显示或编辑时,页面中的文本对象是不能换行的;会导致在可查看固定版式文档的应用程序中,以文本段落的结构来选中文本内容,并进行高亮、下划线等标注时,会比较困难。
[0003]针对上述问题,现有技术虽然提供很多改进方法,但在显示或编辑时,仍然存在选择效果乱序,得到的选择结果可能不是按照寻常所理解的文本段落的结构来进行选择所得到的结果。

技术实现思路

[0004]本专利技术实施例的目的是提供一种选择方法、装置、计算机设备及存储介质,旨在解决现有技术中对文本内容进行选择的准确率以及对文本内容进行标记的效果还有待提高的问题。
[0005]第一方面,本专利技术实施例提供了一种选择方法,其包括:
[0006]构建文本的文本数据结构,并建立与所述文本数据结构对应的光标数据结构;
[0007]接收用户给定的起点坐标和终点坐标,在所述文本数据结构中寻找所述起点坐标的位置和终点坐标的位置,并在所述光标数据结构中分别匹配出对应的起点光标位置和终点光标位置;
[0008]根据所述起点光标位置和终点光标位置确定文本范围,并对所述文本范围内的文本内容进行选择。
[0009]第二方面,本专利技术实施例提供了一种选择装置,其包括:
[0010]构建单元,用于构建文本的文本数据结构,并建立与所述文本数据结构对应的光标数据结构;
[0011]寻找单元,用于接收用户给定的起点坐标和终点坐标,在所述文本数据结构中寻找所述起点坐标的位置和终点坐标的位置,并在所述光标数据结构中分别匹配出对应的起点光标位置和终点光标位置;
[0012]选择单元,用于根据所述起点光标位置和终点光标位置确定文本范围,并对所述文本范围内的文本内容进行选择。
[0013]第三方面,本专利技术实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的选择方法。
[0014]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述
第一方面所述的选择方法。
[0015]本专利技术实施例公开了一种选择方法、装置、计算机设备及其储存介质,该方法包括构建文本的文本数据结构,并建立与文本数据结构对应的光标数据结构;接收用户给定的起点坐标和终点坐标,在文本数据结构中寻找起点坐标的位置和终点坐标的位置,并在光标数据结构中分别匹配出对应的起点光标位置和终点光标位置;根据起点光标位置和终点光标位置确定文本范围,并对文本范围内的文本内容进行选择。本专利技术实施例通过提供的起点坐标和终点坐标,计算文本数据结构中被选中的区域,具有文本内容选择准确高,便于后续进行标注的优点。
附图说明
[0016]为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]图1为本专利技术实施例提供的选择方法的流程示意图;
[0018]图2为本专利技术实施例提供的选择方法的子流程示意图;
[0019]图3为本专利技术实施例提供的选择方法的又一子流程示意图;
[0020]图4为本专利技术实施例提供的选择方法的又一子流程示意图;
[0021]图5为本专利技术实施例提供的选择方法的又一子流程示意图;
[0022]图6为本专利技术实施例提供的选择方法的又一子流程示意图;
[0023]图7为本专利技术实施例提供的选择方法的又一子流程示意图;
[0024]图8为本专利技术实施例提供的选择方法的又一子流程示意图;
[0025]图9为本专利技术实施例提供的选择装置的示意图。
具体实施方式
[0026]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术实施例的保护的范围。
[0027]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0028]还应当理解,在此本专利技术实施例的说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术实施例。如在本专利技术实施例的说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0029]还应当进一步理解,在本专利技术实施例的说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0030]请参阅图1,图1为本专利技术实施例提供的选择方法的流程示意图;
[0031]如图1所示,该方法包括步骤S101~S103。
[0032]S101、构建文本的文本数据结构,并建立与文本数据结构对应的光标数据结构。
[0033]本实施例中,对文本中所有的文本对象进行分析和辨识,以获得文本单词、文本行、文本段落、文本块以及文本流的逻辑关系,并利用文本单词、文本行、文本段落、文本块以及文本流的逻辑关系构建文本的文本数据结构,同时建立与文本数据结构对应的光标数据结构,通过光标数据结构记录对应的文本流对象、文本块对象、文本段落对象、文本行对象、文本单词对象以及它们的下标和虚拟字符的下标,可以精确定位到任意文本单词中的任意一个虚拟字符的前方或者后方,通过这些光标信息,可指定出要操作的文本位置或者文本范围。
[0034]本专利技术实施例可应用于固定版式文档,如PDF文档,在可查看固定版式文档的应用程序中,以文本段落的结构来选中文本内容,并进行高亮、下划线等标注时,具有选择准确,以便进行标注的优点。
[0035]在一实施例中,如图2所示,步骤S101包括:
[0036]S201、确认文本中的文本对象,并依次逐级构建出文本单词、文本行、文本段落、文本块、文本流以及文本板面对象;
[0037]S202、将构建的选择文本板面对象作为文本数据结构。
[0038]本实施例中,构建文本板面对象的过程即为构建文本数据结构的过程:由一个或多个文本对象构建文本单词,选择文本单词中包含虚拟字符与文本对象中实际字符之间的映射关系;由一个或多个文本单词构建文本行;由本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种选择方法,其特征在于,包括:构建文本的文本数据结构,并建立与所述文本数据结构对应的光标数据结构;接收用户给定的起点坐标和终点坐标,在所述文本数据结构中寻找所述起点坐标的位置和终点坐标的位置,并在所述光标数据结构中分别匹配出对应的起点光标位置和终点光标位置;根据所述起点光标位置和终点光标位置确定文本范围,并对所述文本范围内的文本内容进行选择。2.根据权利要求1所述的选择方法,其特征在于,所述构建文本的文本数据结构,包括:确认文本中的文本对象,并依次逐级构建出文本单词、文本行、文本段落、文本块、文本流以及文本板面对象;将构建的所述文本板面对象作为文本数据结构。3.根据权利要求2所述的选择方法,其特征在于,所述接收用户给定的起点坐标和终点坐标,在所述文本数据结构中寻找所述起点坐标的位置和终点坐标的位置,并在所述光标数据结构中分别匹配出对应的起点光标位置和终点光标位置,包括:在所有文本流中寻找出所述起点坐标所在的第一文本块,并构建第一文本块备选集合;以及在所有文本流中寻找出所述终点坐标所在的第二文本块,并构建第二文本块备选集合;在所述第一文本块备选集合中寻找出所述起点坐标所在的第一文本段落,并构建第一文本段落备选集合;以及在所述第二文本块备选集合中寻找出所述终点坐标所在的第二文本段落,并构建第二文本段落备选集合;在所述第一文本段落备选集合中寻找出所述起点坐标所在的第一文本行,并构建第一文本行落备选集合;以及在所述第二文本段落备选集合中寻找出所述终点坐标所在的第二文本行,并构建第二文本行备选集合;在所述第一文本行备选集合中寻找出所述起点坐标落所在的第一文本单词,并构建第一文本单词备选集合;以及在所述第二文本行备选集合中寻找出所述终点坐标所在的第二文本单词,并构建第二文本单词备选集合;在所述第一文本单词备选集合中寻找出所述起点坐标所在的第一虚拟字符,并构建第一虚拟字符备选集合;以及在所述第二文本单词备选集合中寻找出所述终点坐标所在的第二虚拟字符,并构建第二虚拟字符备选集合;基于所述光标数据结构,在所述第一虚拟字符备选集合选出与所述起点坐标的距离最接近的第一光标位置,并构建第一光标备选集合;以及在所述第二虚拟字符备选集合中选出与所述终点坐标的距离最接近的第二光标位置,并构建第二光标备选集合;从所述第一光标备选集合中选择直线距离最接近所述起点坐标的第一光标位置,作为起点光标位置;以及从所述第二光标备选集合中选择直线距离最接近所述终点坐标的第二光标位置,作为终点光标位置。4.根据权利要求3所述的选择方法,其特征在于,所述接收用户给定的起点坐标和终点坐标,在所述文本数据结构中寻找所述起点坐标的位置和终点坐标的位置,并在所述光标数据结构中分别匹配出对应的起点光标位置和终点光标位置,还包括:若未能在所述第一文本单词备选集合中寻找出所述起点坐标所在的第一虚拟字符;以
及未能在所述第二文本单词备选集合中寻找出所述终点坐标所在的第二虚拟字符;则在所有文本流中寻找出所述起点坐标距离最近的第一文本块,并构建第一文本块备选集合;以及在所有文本流中寻找出所述终点坐标距离最近的第二文本块,并构建第二文本块备选集合;在所述第一文本块备选集合中寻找出所述起点坐标距离最近的第一文本段落,并构建第一文本段落备选集合;以及在所述第二文本块备选集合中寻找出所述终点坐标距离最近的第二文本段落,并构建第二文本段落备选集合;在所述第一文本段落备选集合中寻找出所述起点坐标距离最近的第一文本行,并构建第一文本行备选集合;以及在所述第二文本段落备选集合中寻找出所述终点坐标距离最近的第二文本行,并构建第二文本行备选集合;在所述第一文本行备选集合中寻...

【专利技术属性】
技术研发人员:李譞
申请(专利权)人:万兴科技湖南有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1