文本划分方法、装置、设备和计算机可读介质制造方法及图纸

技术编号：26066591 阅读：21 留言：0更新日期：2020-10-28 16:39

本公开的实施例公开了文本划分方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括：基于目标文本的长度，确定目标文本对应的目标语音中的第一静默语音片段的时长阈值；基于时长阈值，确定第一文本划分位置；在第一文本划分位置处划分目标文本，得到第一文本片段集合；划分第一文本片段集合中长度超过第一预设阈值的文本片段，得到第二文本片段集合。该实施方式解决了文本划分结果琐碎和划分结果过长的问题，为后续完整工整地将文本展现在尺寸有限的显示屏上提供了技术支持。

全部详细技术资料下载

【技术实现步骤摘要】
文本划分方法、装置、设备和计算机可读介质
本公开的实施例涉及计算机
，具体涉及文本划分方法、装置、设备和计算机可读介质。
技术介绍
在现阶段，人们通常需要为一些视频添加字幕，即在显示屏上显示视频中语音对应的文本。但是因为显示屏的尺寸有限，需要将文本分段，进一步将不同的文本段在不同的时间显示在显示屏上。然而，现有的分段方法存在分段结果琐碎或分段结果过长的问题，使文本段不能完整工整地显示在显示屏上，影响用户观看视频的体验。
技术实现思路
本公开的内容部分用于以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。本公开的一些实施例提出了文本划分方法、装置、设备和计算机可读介质，来解决以上
技术介绍
部分提到的技术问题。第一方面，本公开的一些实施例提供了一种文本划分方法，该方法包括：基于目标文本的长度，确定目标文本对应的目标语音中的第一静默语音片段的时长阈值；基于时长阈值，确定第一文本划分位置；在第一文本划分位置处划分目标文本，得到第一文本片段集合；划分第一文本片段集合中长度超过第一预设阈值的文本片段，得到第二文本片段集合。第二方面，本公开的一些实施例提供了一种文本划分装置，装置包括：第一确定单元，配置用于基于目标文本的长度，确定目标文本对应的目标语音中的第一静默语音片段的时长阈值；第二确定单元，配置用于基于时长阈值，确定第一文本划分位置；第一划分单元，...

【技术保护点】
1.一种文本划分方法，包括：/n基于目标文本的长度，确定目标文本对应的目标语音中的第一静默语音片段的时长阈值；/n基于所述时长阈值，确定第一文本划分位置；/n在所述第一文本划分位置处划分所述目标文本，得到第一文本片段集合；/n划分第一文本片段集合中长度超过第一预设阈值的文本片段，得到第二文本片段集合。/n

【技术特征摘要】
1.一种文本划分方法，包括：
基于目标文本的长度，确定目标文本对应的目标语音中的第一静默语音片段的时长阈值；
基于所述时长阈值，确定第一文本划分位置；
在所述第一文本划分位置处划分所述目标文本，得到第一文本片段集合；
划分第一文本片段集合中长度超过第一预设阈值的文本片段，得到第二文本片段集合。

2.根据权利要求1所述的方法，其中，所述目标文本对应的目标语音是通过以下步骤得到的：
将目标文本对应的原语音中每个说话语音片段的尖峰信号调整到所述说话语音片段的中间位置，得到目标文本对应的目标语音。

3.根据权利要求1所述的方法，其中，所述基于目标文本的长度，确定目标文本对应的目标语音中第一静默语音片段的时长阈值，包括：
响应于所述文本的长度大于或等于预设文本长度阈值，将第一预设时长阈值确定为所述第一静默语音片段的时长阈值。

4.根据权利要求3所述的方法，其中，所述基于目标文本的长度，确定目标文本对应的目标语音中第一静默语音片段的时长阈值，还包括：
响应于所述文本的长度小于所述预设文本长度阈值，将第二预设时长阈值确定为所述第一静默语音片段的时长阈值。

5.根据权利要求1所述的方法，其中，所述划分第一文本片段集合中长度超过第一预设阈值的第一文本片段，得到第二文本片段集合，包括：
确定所述第一文本片段对应的语音中的第二静默语音片段；
基于所述第一文本片段对应的语音中第二静默语音片段与所述第一文本片段对应...

【专利技术属性】
技术研发人员：蔡猛，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人