文档内容导出方法、导出装置、电子设备及存储介质制造方法及图纸

技术编号:27212244 阅读:15 留言:0更新日期:2021-02-04 11:27
本发明专利技术实施例提供了一种文档内容导出方法、导出装置、电子设备及存储介质,其中方法包括:从待处理文档中获取第一内容,第一内容在待处理文档中具有预设标识,第一内容包括:文本内容,公式内容,或者图片内容;基于第一内容,以及第一内容的前后文的文档符号,确定第二内容,第二内容为包括第一内容的句子或段落,文档符号用于标识句子或者段落结束;导出第二内容。本发明专利技术实施例能够解决现有的文档内容导出方法只能导出具有标识的内容的技术问题。题。题。

【技术实现步骤摘要】
文档内容导出方法、导出装置、电子设备及存储介质


[0001]本专利技术涉及办公软件
,特别是涉及一种文档内容导出方法、导出装置、电子设备及存储介质。

技术介绍

[0002]日常工作中,人们在阅读文档时,经常需要对文档中的一些重要的内容做标识,例如,对这些内容高亮显示或者添加下划线,然后将这些具有标识的内容导出生成一个新文档,便于快速查询这些内容。
[0003]现有技术中,用户在使用导出重点内容的功能后,系统通常仅仅将具有标识的内容导出,具体过程为:系统首先按照文档的阅读顺序,依次查找文档中具有标识的内容,由于这些标识均是预设的,因此系统可以直接查找到文档中具有标识的内容,然后将这些具有标识的内容导出,生成一个包含这些内容的新文档,例如,如果文档中具有标识的内容为关键词,则系统导出的也为关键词;如果文档中具有标识的内容为句子,则系统导出的也为句子。
[0004]但是,现有的文档重点内容导出方法,只能导出具有标识的内容,即,标识什么,则导出什么,因此导出的内容容易因脱离上下文关系而难于理解,导致用户阅读体验不佳。

技术实现思路

[0005]本专利技术实施例的目的在于提供一种文档内容导出方法、导出装置、电子设备及存储介质,以解决现有的文档内容导出方法只能导出具有标识的内容的技术问题。具体技术方案如下:
[0006]第一方面,本专利技术实施例提供了一种文档内容导出方法,所述方法包括:
[0007]从待处理文档中获取第一内容,所述第一内容在所述待处理文档中具有预设标识,所述第一内容包括:文本内容,公式内容,或者图片内容;
[0008]基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容,所述第二内容为包括所述第一内容的句子或段落,所述文档符号用于标识句子或者段落结束;
[0009]导出所述第二内容。
[0010]可选地,所述基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容的步骤,包括:
[0011]基于所述第一内容,以及所述第一内容的前后文中与所述第一内容之间的字数最少的所述文档符号,确定所述第二内容。
[0012]可选地,在所述基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容之前,所述方法还包括:
[0013]获取用户针对第一选择界面中各预设选择项的第一选择结果,所述第一选择界面中设置有针对不同导出方式的选择项,所述导出方式包括:导出整句内容,以及导出整段内容;
[0014]所述基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容的步骤,包括:
[0015]根据所述第一选择结果所确定的导出方式,在所述待处理文档中确定位于所述第一内容之前的文本内容的第一符号,以及确定位于所述第一内容之后的文本内容的第二符号;
[0016]确定所述第一符号和所述第二符号之间的内容为所述第二内容。
[0017]可选地,所述基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容的步骤,包括:
[0018]在所述待处理文档中,以所述第一内容的第一个字符作为第一起始查找点,向前查找与所述第一内容之间的字数最少的文档符号,作为所述第一符号;
[0019]在所述待处理文档中,以所述第一内容的最后一个字符作为第二起始查找点,向后查找与所述第一内容之间的字数最少的文档符号,作为所述第二符号;
[0020]将所述第一符号与所述第二符号之间的内容,确定为所述第二内容。
[0021]可选地,在所述从待处理文档中获取第一内容之前,所述方法还包括:
[0022]获取用户针对第二选择界面中各预设选择项的第二选择结果,所述第二选择界面中设置有针对不同预设标识的选择项;
[0023]所述导出所述第二内容的步骤,包括:
[0024]根据所述第二选择结果所确定的不同预设标识,导出多个第二内容,所述多个第二内容中包括:具有不同预设标识的第一内容所对应的第二内容。
[0025]可选地,在所述导出所述第二内容之前,所述方法还包括:
[0026]获取用户针对第三选择界面中各预设选择项的第三选择结果,所述第三选择界面中设置有是否导出所述待处理文档的目录的选择项;
[0027]所述导出所述第二内容的步骤,包括:
[0028]从所述待处理文档的预设存储结构信息中获取所述待处理文档的目录,以及与所述目录中的各目录层级对应的节点标识,一个所述节点标识用于标识一个目录层级;
[0029]确定在所述待处理文档中位于所述第二内容之前,且与所述第二内容之间的字数最少的节点标识;
[0030]根据所确定的所述节点标识,确定所述第二内容与所述目录层级的对应关系;
[0031]根据所述对应关系,将所述第二内容添加至与所述第二内容对应的目录层级下,并将所述第二内容和所述目录共同导出。
[0032]可选地,所述从待处理文档中获取第一内容的步骤,包括:
[0033]从所述待处理文档中获取多个所述第一内容;
[0034]所述基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容的步骤,包括:
[0035]分别根据多个所述第一内容,以及所述第一内容的前后文的所述文档符号,确定每个与所述第一内容对应的所述第二内容;
[0036]当存在多个相同的第二内容时,保留所述多个相同的第二内容中的一个第二内容,并将所述多个相同的第二内容中的其他第二内容删除;
[0037]当不存在所述多个相同的第二内容时,执行所述导出所述第二内容的步骤。
[0038]第二方面,本专利技术实施例提供了一种文档内容导出装置,所述装置包括:
[0039]第一获取模块,用于从待处理文档中获取第一内容,所述第一内容在所述待处理文档中具有预设标识,所述第一内容包括:文本内容,公式内容,或者图片内容;
[0040]确定模块,用于基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容,所述第二内容为包括所述第一内容的句子或段落,所述文档符号用于标识句子或者段落结束;
[0041]导出模块,用于导出所述第二内容。
[0042]可选地,所述确定模块具体用于:
[0043]基于所述第一内容,以及所述第一内容的前后文中与所述第一内容之间的字数最少的所述文档符号,确定所述第二内容。
[0044]可选地,所述装置还包括:
[0045]第二获取模块,用于获取用户针对第一选择界面中各预设选择项的第一选择结果,所述第一选择界面中设置有针对不同导出方式的选择项,所述导出方式包括:导出整句内容,以及导出整段内容;
[0046]所述确定模块包括:
[0047]第一确定子模块,用于根据所述第一选择结果所确定的导出方式,在所述待处理文档中确定位于所述第一内容之前的文本内容的第一符号,以及确定位于所述第一内容之后的文本内容的第二符号;
[0048]第二确定子模块,用于确定本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文档内容导出方法,其特征在于,所述方法包括:从待处理文档中获取第一内容,所述第一内容在所述待处理文档中具有预设标识,所述第一内容包括:文本内容,公式内容,或者图片内容;基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容,所述第二内容为包括所述第一内容的句子或段落,所述文档符号用于标识句子或者段落结束;导出所述第二内容。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容的步骤,包括:基于所述第一内容,以及所述第一内容的前后文中与所述第一内容之间的字数最少的所述文档符号,确定所述第二内容。3.根据权利要求1或2所述的方法,其特征在于,在所述基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容之前,所述方法还包括:获取用户针对第一选择界面中各预设选择项的第一选择结果,所述第一选择界面中设置有针对不同导出方式的选择项,所述导出方式包括:导出整句内容,以及导出整段内容;所述基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容的步骤,包括:根据所述第一选择结果所确定的导出方式,在所述待处理文档中确定位于所述第一内容之前的文本内容的第一符号,以及确定位于所述第一内容之后的文本内容的第二符号;确定所述第一符号和所述第二符号之间的内容为所述第二内容。4.根据权利要求3所述的方法,其特征在于,所述基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容的步骤,包括:在所述待处理文档中,以所述第一内容的第一个字符作为第一起始查找点,向前查找与所述第一内容之间的字数最少的文档符号,作为所述第一符号;在所述待处理文档中,以所述第一内容的最后一个字符作为第二起始查找点,向后查找与所述第一内容之间的字数最少的文档符号,作为所述第二符号;将所述第一符号与所述第二符号之间的内容,确定为所述第二内容。5.根据权利要求1所述的方法,其特征在于,在所述从待处理文档中获取第一内容之前,所述方法还包括:获取用户针对第二选择界面中各预设选择项的第二选择结果,所述第二选择界面中设置有针对不同预设标识的选择项;所述导出所述第二内容的步骤,包括:根据所述第二选择结果所确定的不同预设标识,导出多个第二内容,所述多个第二内容中包括:具有不同预设标识的第一内容所对应的第二内容。6.根据权利要求1所述的方法,其特征在于,在所述导出所述第二内容之前,所述方法还包括:获取用户针对第三选择界面中各预设选择项的第三选择结果,所述第三选择界面中设置有是否导出所述待处理文档的目录的选择项;所述导出所述第二内容的步骤,包括:从所述待处理文档的预设存储结构信息中获取所述待处理文档的目录,以及与所述目
录中的各目录层级对应的节点标识,一个所述节点标识用于标识一个目录层级;确定在所述待处理文档中位于所述第二内容之前,且与所述第二内容之间的字数最少的节点标识;根据所确定的所述节点标识,确定所述第二内容与所述目录层级的对应关系;根据所述对应关系,将所述第二内容添加至与所述第二内容对应的目录层级下,并将所述第二内容和所述目录共同导出。7.根据权利要求1所述的方法,其特征在于,所述从待处理文档中获取第一内容的步骤,包括:从所述待处理文档中获取多个所述第一内容;所述基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容的步骤,包括:分别根据多个所述第一内容,以及所述第一内容的前后文的所述文档符号,确定每个与所述第一内容对应的所述第二内容;当存在多个相同的第二内容时,保留所述多个相同的第二内容中的一个第二内容,并将所述多个相同的第二内容中的其他第二内容删除;当不存在所述多个相同的第二内容时,执行所述导出所述第二内容的步骤。8.一种文档内容导出装置,其特征在于,所述装置包括:第一获取模块,用于从待处理文档中获取第一内容,所述第一内容在所述待处理文档中具有预设标识,所述第一内容包...

【专利技术属性】
技术研发人员:欧振羽
申请(专利权)人:北京金山办公软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1