信息处理方法、设备和介质技术

技术编号：29136589 阅读：26 留言：0更新日期：2021-07-02 22:32

本公开公开了一种信息处理方法、设备和介质，涉及数据处理技术领域。该方法包括：将字幕对应的语音转换为声学基元，以及，确定所述语音的时间信息；根据预先建立的映射关系，确定与所述声学基元对应的内容单元，所述内容单元为所述字幕对应的文本中的内容单元，所述映射关系包括所述声学基元与所述内容单元之间的映射关系；基于所述时间信息和所述内容单元，构建包含时间信息的文本，并基于所述包含时间信息的文本，构建字幕文件。本公开可以提高字幕文件的生成效率。

全部详细技术资料下载

【技术实现步骤摘要】
信息处理方法、设备和介质
本公开涉及数据处理
，尤其涉及一种信息处理方法、设备和介质。
技术介绍
用户在观看视频时，可以通过视频显示界面上的字幕理解视频内容。视频提供者可以录制视频，以及制作与该视频对应的字幕文件，再将视频与字幕文件进行合成，以得到添加有字幕的视频。相关技术中，字幕文件采用离线非线性编辑的方式得到。但是，这种方式存在效率低的问题。
技术实现思路
本公开提供了一种信息处理方法、设备和介质。根据本公开的一方面，提供了一种信息处理方法，包括：将字幕对应的语音转换为声学基元，以及，确定所述语音的时间信息；根据预先建立的映射关系，确定与所述声学基元对应的内容单元，所述内容单元为所述字幕对应的文本中的内容单元，所述映射关系包括所述声学基元与所述内容单元之间的映射关系；基于所述时间信息和所述内容单元，构建包含时间信息的文本，并基于所述包含时间信息的文本，构建字幕文件。根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上述任一方面的任一项所述的方法。根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据上述任一方面的任一项所述的方法。根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在...

【技术保护点】
1.一种信息处理方法，其特征在于，包括：/n将字幕对应的语音转换为声学基元，以及，确定所述语音的时间信息；/n根据预先建立的映射关系，确定与所述声学基元对应的内容单元，所述内容单元为所述字幕对应的文本中的内容单元，所述映射关系包括所述声学基元与所述内容单元之间的映射关系；/n基于所述时间信息和所述内容单元，构建包含时间信息的文本，并基于所述包含时间信息的文本，构建字幕文件。/n

【技术特征摘要】
1.一种信息处理方法，其特征在于，包括：
将字幕对应的语音转换为声学基元，以及，确定所述语音的时间信息；
根据预先建立的映射关系，确定与所述声学基元对应的内容单元，所述内容单元为所述字幕对应的文本中的内容单元，所述映射关系包括所述声学基元与所述内容单元之间的映射关系；
基于所述时间信息和所述内容单元，构建包含时间信息的文本，并基于所述包含时间信息的文本，构建字幕文件。

2.根据权利要求1所述的方法，其特征在于，所述将字幕对应的语音转换为声学基元，包括：
采用预先建立的深度神经网络模型，将字幕对应的语音转换为声学基元，所述深度神经网络模型用于将语音转换为声学基元。

3.根据权利要求1所述的方法，其特征在于，所述映射关系为文本信息与关联信息的对应关系，所述根据预先建立的声学基元与内容单元之间的映射关系，确定与所述声学基元对应的内容单元，包括：
基于所述声学基元确定关联信息；
在预先建立的文本信息与关联信息的对应关系中，查找与所述关联信息对应的内容单元信息；
将所述内容单元信息，对应的内容单元确定为所述声学单元对应的内容单元。

4.根据权利要求3所述的方法，其特征在于，所述内容单元信息包括内容单元的文字编码，所述方法还包括：
将所述字幕对应的文本中的每个文字，转换为文字编码；
获取所述每个文字的声学基元，并确定所述声学基元对应的关联信息；
建立所述文字编码与所述关联信息的对应关系。

5.根据权利要求3所述的方法，其特征在于，...

【专利技术属性】
技术研发人员：胡其斌，董宗保，单益峰，
申请(专利权)人：上海掌门科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人