电子文本生成方法、装置、设备及介质制造方法及图纸

技术编号:30410542 阅读:29 留言:0更新日期:2021-10-20 11:40
本公开实施例涉及一种电子文本生成方法、装置、设备及介质,涉及数据处理技术领域,其中该方法包括:解析出版文档的属于预设文档段类型的多个文档段内容,并确定每个所述文档段内容的显示属性信息,其中,预设文档段类型包括正文文档段类型、扉页文档段类型中的至少一种;根据预设的电子阅读器的排版属性信息和显示属性信息,确定每个文档段内容的排版位置;在排版位置根据显示属性信息对多个文档段内容进行排版绘制处理,以生成与出版文档对应的电子文本。由此,根据出版文档的原始显示属性信息转换成电子文本,且对出版文档的各种类型的文档段无差别转换,不但实现了在电子文本中的图文混排效果,而且保留了出版文档的原始显示方式。示方式。示方式。

【技术实现步骤摘要】
电子文本生成方法、装置、设备及介质


[0001]本公开涉及数据处理
,尤其涉及一种电子文本生成方法、装置、设备及介质。

技术介绍

[0002]随着计算机技术的发展,用户的电子阅读需求也愈发普遍,为了满足用户的电子阅读需求,各种阅读器应运而生。
[0003]相关技术中,可以将出版文档等网页内容中的文字提取出来,根据阅读器的默认字号等,对提取出来的文字进行排版显示。
[0004]然而,上述提取文字展示的阅读器排版显示方式,仅仅针对出版文档中的文字内容进行显示和排版,且排版文字内容时,根据阅读器的默认字号等显示对应的文字内容,一方面,没有对出版文档中的图片等非文字内容进行排版,另一方面,显示文字内容是根据阅读器的默认字号等进行显示的,没有呈现文字内容在出版文档中的显示属性。

技术实现思路

[0005]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种电子文本的生成方法、装置、设备及介质,根据出版文档的原始显示属性信息转换成电子文本,且对出版文档的各种类型的文档段无差别转换,不但实现了在电子文本中本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种电子文本生成方法,其特征在于,包括:解析出版文档的属于预设文档段类型的多个文档段内容,并确定每个所述文档段内容的显示属性信息,其中,所述预设文档段类型包括正文文档段类型、扉页文档段类型中的至少一种;根据预设的电子阅读器的排版属性信息和所述显示属性信息,确定每个所述文档段内容的排版位置;在所述排版位置根据所述显示属性信息对所述多个文档段内容进行排版绘制处理,以生成与所述出版文档对应的电子文本。2.如权利要求1所述的方法,其特征在于,所述解析出版文档的属于预设文档段类型的多个文档段内容,包括:确定与所述预设文档段类型对应的文档段开始标记和文档段结束标;解析每个所述文档段开始标记到相邻的文档段结束标记之间的文档内容,以获取所述多个文档段内容。3.如权利要求1所述的方法,其特征在于,所述根据预设的电子阅读器的排版属性信息和所述显示属性信息,确定每个所述文档段内容的排版位置,包括:根据所述显示属性信息确定每个所述文档段内容中每个内容单元的第一显示尺寸;根据所述排版属性信息确定所述电子阅读器中每个显示单元的第二显示尺寸;根据所述第二显示尺寸和所述第一显示尺寸对所述每个内容单元排版,以确定每个所述文档段内容的排版位置。4.如权利要求3所述的方法,其特征在于,所述根据所述显示属性信息确定每个所述文档段内容中每个内容单元的第一显示尺寸,包括:当内容单元为文本内容时,获取所述文本内容的字号样式和字体样式;根据所述字号样式和字体样式确定所述文本内容的第一显示尺寸;当内容单元为图片内容时,获取所述图片内容的图片尺寸;根据所述图片尺寸确定所述图片内容的第一显示尺寸。5.如权利要求1所述的方法,其特征在于,当所述预设文档段类型为扉页文档段类型时,在所述排版位置根据所述显示属性信息对所述多个文档段内容进行排版绘制处理之后,还包括:获取所述扉页段的背景图片;在所述扉页段对应的排版位置的背景区域渲染所述背景图片。6.如权利要求1

5任一所述的方法,其特征在于,还包括:获取所述出版文档的所有目录标题;根据所述出版文档的网页代码,获取每个所述目录标题的目录层级标识,并根据所述目录层级标识构建所述所有目录标题的层级结构顺序;根据所述排版属性信息对所述所有目录标题按照所述层级结构顺序进行排本绘制处理。7.如权利要求6所述的方法,其特征在于,确定所述出版文档的正文文档段类型的所有正文文档段内容;根据所述出版文档的网页代码,获取所述正文段落的所属目录层级标识;根据所述所属目录层级标识,在所述所...

【专利技术属性】
技术研发人员:郑佳锋张玮维
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1