一种电子点读读物制作方法、装置、电子设备和存储介质制造方法及图纸

技术编号:29133992 阅读:11 留言:0更新日期:2021-07-02 22:29
本申请提供了一种电子点读读物制作方法、装置、电子设备和存储介质,其中,该方法包括:在得到电子文档包括的各最小可读元素的索引信息,以及根据索引信息,得到各音频数据的文件名称后,对于电子文档中的每个最小可读元素,确定该最小可读元素所在区域在电子文档中的坐标信息,并记录该最小可读元素和坐标信息的第一对应关系;根据该最小可读元素对应的目标音频数据中各字符的发音时间,确定该最小可读元素的发音起始时间和发音结束时间;根据索引信息、坐标信息、第一对应关系、发音起始时间、发音结束时间、文件名称和电子文档,生成电子点读读物,通过上述方法有利于降低人工工作量。

【技术实现步骤摘要】
一种电子点读读物制作方法、装置、电子设备和存储介质
本申请涉及计算机
,具体而言,涉及一种电子点读读物制作方法、装置、电子设备和存储介质。
技术介绍
目前市场上有大量的电子有声绘本和电子点读教材等电子点读读物,这些产品可以加载到智能手机或者平板电脑上,通过点读的形式播放语音。在现有技术中,电子点读读物在制作过程中需要大量人工处理,如包括:图片扫描、音频切割、点读位置坐标测量、索引数据整理等,制作过程相对繁琐,从而导致人工工作量相对较大。
技术实现思路
有鉴于此,本申请实施例提供了一种电子点读读物制作方法、装置、电子设备和存储介质,以降低电子点读读物在制作过程中的人工工作量。第一方面,本申请实施例提供了一种电子点读读物制作方法,包括:在获取到待生成的电子点读读物的电子文档,以及按照所述电子文档中的章节顺序依次输入的所述电子文档包含的各章节对应的音频数据后,根据所述电子文档每页的最小可读元素,生成所述电子文档包括的各最小可读元素的索引信息;以及根据所述索引信息,按照所述音频数据的输入顺序为各所述音频数据进行重命名,以得到各所述音频数据的文件名称;对于所述电子文档中的每个最小可读元素,确定该最小可读元素所在区域在所述电子文档中的坐标信息,并记录该最小可读元素和所述坐标信息的第一对应关系;根据该最小可读元素对应的目标音频数据中各字符的发音时间,确定该最小可读元素的发音起始时间和发音结束时间;根据所述索引信息、所述坐标信息、所述第一对应关系、所述发音起始时间、所述发音结束时间、所述文件名称和所述电子文档,生成所述电子点读读物。可选地,所述索引信息包括:所述电子文档的图书名称、所述最小可读元素所在章节的章节信息、所述最小可读元素所在页码的页码信息和所述最小可读元素的标识。可选地,所述坐标信息包括:该最小可读元素所在的目标章节、该最小可读元素所在的目标页码和该最小可读元素在所述目标页码对应的目标页面中所在矩形区域的两个对角定点的坐标。可选地,所述确定该最小可读元素所在区域在所述电子文档中的坐标信息,包括:确定该最小可读元素所覆盖的候选区域;按照预设扩大规则,对所述候选区域进行扩大处理,得到目标区域,以将所述目标区域作为该最小可读元素的所在区域,其中,位于同一页面上的各最小可读元素对应的目标区域不交叠;根据所述目标区域,确定该最小可读元素所在区域在所述电子文档中的坐标信息。可选地,所述根据该最小可读元素对应的目标音频数据中各字符的发音时间,确定该最小可读元素的发音起始时间和发音结束时间,包括:对所述目标音频数据进行语音识别,得到所述目标音频数据的文本信息,以及所述目标音频数据中各字符的发音时间;根据所述目标音频数据中各字符的发音时间,确定所述文本信息中的各字符的发音起始时间和发音结束时间;确定所述文本信息中包括的各文本段落中和该最小可读元素相似度最高的目标文本段落,以将所述目标文本段落的首字符的发音起始时间作为该最小可读元素的发音起始时间,将所述目标文本段落的尾字符的发音结束时间作为该最小可读元素的发音结束时间。可选地,所述根据所述索引信息、所述坐标信息、所述第一对应关系、所述发音起始时间、所述发音结束时间、所述文件名称和所述电子文档,生成所述电子点读读物,包括:对于所述电子文档中的每个最小可读元素,生成该最小可读元素对应的音频数据的文件名称、该最小可读元素对应的坐标信息、该最小可读元素对应的发音起始时间、该最小可读元素对应的发音结束时间和该最小可读元素对应的索引信息之间的第二对应关系;根据所述电子文档和所述第二对应关系,生成所述电子点读读物。可选地,所述方法还包括:根据待生成的数据包的数据包类型,对所述电子点读读物进行加密,得到加密数据,其中,所述数据包类型包括在线数据包和离线数据包;将所述加密数据发送给云端服务器。第二方面,本申请实施例提供了一种电子点读读物制作装置,包括:输入单元,用于在获取到待生成的电子点读读物的电子文档,以及按照所述电子文档中的章节顺序依次输入的所述电子文档包含的各章节对应的音频数据后,根据所述电子文档每页的最小可读元素,生成所述电子文档包括的各最小可读元素的索引信息;以及根据所述索引信息,按照所述音频数据的输入顺序为各所述音频数据进行重命名,以得到各所述音频数据的文件名称;第一确定单元,用于对于所述电子文档中的每个最小可读元素,确定该最小可读元素所在区域在所述电子文档中的坐标信息,并记录该最小可读元素和所述坐标信息的第一对应关系;第二确定单元,用于根据该最小可读元素对应的目标音频数据中各字符的发音时间,确定该最小可读元素的发音起始时间和发音结束时间;生成单元,用于根据所述索引信息、所述坐标信息、所述第一对应关系、所述发音起始时间、所述发音结束时间、所述文件名称和所述电子文档,生成所述电子点读读物。可选地,所述索引信息包括:所述电子文档的图书名称、所述最小可读元素所在章节的章节信息、所述最小可读元素所在页码的页码信息和所述最小可读元素的标识。可选地,所述坐标信息包括:该最小可读元素所在的目标章节、该最小可读元素所在的目标页码和该最小可读元素在所述目标页码对应的目标页面中所在矩形区域的两个对角定点的坐标。可选地,所述第一确定单元在用于确定该最小可读元素所在区域在所述电子文档中的坐标信息时,包括:确定该最小可读元素所覆盖的候选区域;按照预设扩大规则,对所述候选区域进行扩大处理,得到目标区域,以将所述目标区域作为该最小可读元素的所在区域,其中,位于同一页面上的各最小可读元素对应的目标区域不交叠;根据所述目标区域,确定该最小可读元素所在区域在所述电子文档中的坐标信息。可选地,所述第二确定单元在用于根据该最小可读元素对应的目标音频数据中各字符的发音时间,确定该最小可读元素的发音起始时间和发音结束时间时,包括:对所述目标音频数据进行语音识别,得到所述目标音频数据的文本信息,以及所述目标音频数据中各字符的发音时间;根据所述目标音频数据中各字符的发音时间,确定所述文本信息中的各字符的发音起始时间和发音结束时间;确定所述文本信息中包括的各文本段落中和该最小可读元素相似度最高的目标文本段落,以将所述目标文本段落的首字符的发音起始时间作为该最小可读元素的发音起始时间,将所述目标文本段落的尾字符的发音结束时间作为该最小可读元素的发音结束时间。可选地,所述生成单元在用于根据所述索引信息、所述坐标信息、所述第一对应关系、所述发音起始时间、所述发音结束时间、所述文件名称和所述电子文档,生成所述电子点读读物时,包括:对于所述电子文档中的每个最小可读元素,生成该最小可读元素对应的音频数据的文件名称、该最小可读元素对应的坐标信息、该最小可读元素对应的发音起始时间、该最小可读元素对应的发音结束时间和该最小可读元素对应的索引信息之间的第二对应关系本文档来自技高网...

【技术保护点】
1.一种电子点读读物制作方法,其特征在于,包括:/n在获取到待生成的电子点读读物的电子文档,以及按照所述电子文档中的章节顺序依次输入的所述电子文档包含的各章节对应的音频数据后,根据所述电子文档每页的最小可读元素,生成所述电子文档包括的各最小可读元素的索引信息;以及根据所述索引信息,按照所述音频数据的输入顺序为各所述音频数据进行重命名,以得到各所述音频数据的文件名称;/n对于所述电子文档中的每个最小可读元素,确定该最小可读元素所在区域在所述电子文档中的坐标信息,并记录该最小可读元素和所述坐标信息的第一对应关系;/n根据该最小可读元素对应的目标音频数据中各字符的发音时间,确定该最小可读元素的发音起始时间和发音结束时间;/n根据所述索引信息、所述坐标信息、所述第一对应关系、所述发音起始时间、所述发音结束时间、所述文件名称和所述电子文档,生成所述电子点读读物。/n

【技术特征摘要】
1.一种电子点读读物制作方法,其特征在于,包括:
在获取到待生成的电子点读读物的电子文档,以及按照所述电子文档中的章节顺序依次输入的所述电子文档包含的各章节对应的音频数据后,根据所述电子文档每页的最小可读元素,生成所述电子文档包括的各最小可读元素的索引信息;以及根据所述索引信息,按照所述音频数据的输入顺序为各所述音频数据进行重命名,以得到各所述音频数据的文件名称;
对于所述电子文档中的每个最小可读元素,确定该最小可读元素所在区域在所述电子文档中的坐标信息,并记录该最小可读元素和所述坐标信息的第一对应关系;
根据该最小可读元素对应的目标音频数据中各字符的发音时间,确定该最小可读元素的发音起始时间和发音结束时间;
根据所述索引信息、所述坐标信息、所述第一对应关系、所述发音起始时间、所述发音结束时间、所述文件名称和所述电子文档,生成所述电子点读读物。


2.如权利要求1所述的方法,其特征在于,所述索引信息包括:所述电子文档的图书名称、所述最小可读元素所在章节的章节信息、所述最小可读元素所在页码的页码信息和所述最小可读元素的标识。


3.如权利要求2所述的方法,其特征在于,所述坐标信息包括:该最小可读元素所在的目标章节、该最小可读元素所在的目标页码和该最小可读元素在所述目标页码对应的目标页面中所在矩形区域的两个对角定点的坐标。


4.如权利要求1所述的方法,其特征在于,所述确定该最小可读元素所在区域在所述电子文档中的坐标信息,包括:
确定该最小可读元素所覆盖的候选区域;
按照预设扩大规则,对所述候选区域进行扩大处理,得到目标区域,以将所述目标区域作为该最小可读元素的所在区域,其中,位于同一页面上的各最小可读元素对应的目标区域不交叠;
根据所述目标区域,确定该最小可读元素所在区域在所述电子文档中的坐标信息。


5.如权利要求1所述的方法,其特征在于,所述根据该最小可读元素对应的目标音频数据中各字符的发音时间,确定该最小可读元素的发音起始时间和发音结束时间,包括:
对所述目标音频数据进行语音识别,得到所述目标音频数据的文本信息,以及所述目标音频数据中各字符的发音时间;
根据所述目标音频数据中各字符的发音时间,确定所述文本信息中的各字符的发音起始时间和发音结束时间;
确定所述文本信息中包括的各文本段落中和该最小可读元素相似度最高的目标文本段落,以将所述目标文本段落的首字符的发音起...

【专利技术属性】
技术研发人员:姜奕欣
申请(专利权)人:上海匠欣信息科技有限公司
类型:发明
国别省市:上海;31

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1