一种字幕对准方法及装置制造方法及图纸

技术编号：15620715 阅读：89 留言：0更新日期：2017-06-14 04:35

本发明专利技术适用计算机技术领域，提供了一种字幕对准方法及装置，所述方法包括：获取音视频数据和初始字幕数据，对音视频数据进行语音识别，确定音色对应的语音区间，根据语音区间生成带时间轴的第一字幕，并对音视频数据进行语音转换得到转换文本信息，依据初始字幕数据和/或转换文本信息对带时间轴的第一字幕进行校准，依据校准结果生成带时间轴的第二字幕。通过本发明专利技术实施例，对音视频数据，可字幕自动对位生成时间轴，并根据语音识别进行再次校准，可对不同音色的语音进行校准，适用于至少一种音色的语音的字幕校准，适用于至少一重字幕的校准，还可对字幕校准进行自修正，大大提高了字幕校准的精准度和适用范围。

全部详细技术资料下载

【技术实现步骤摘要】
一种字幕对准方法及装置
本专利技术属于计算机
，尤其涉及一种字幕对准方法及装置。
技术介绍
多媒体中使用的媒体包括文字、图片、音频(包含音乐、语音旁白、特殊音效)、视频(动画和影片等)，在多媒体制作过程中，可在如图片、音频、视频等播放界面添加字幕，使得在多媒体播放时显示字幕。传统方式使用手拍字幕，通过手动方式确定字幕在时间轴上的起止位置，时间轴上标识句的起止位置，如100句则需要手动输入200次，效率低下，无法适应高精度要求的字幕显示。现有技术中使用软件确定字幕在时间轴上起止位置，但是以句切分，且在出现有多人语音时，无法进一步精确对准字幕，出现将多人语音按噪音处理的现象，字幕校准的精准度低。
技术实现思路
本专利技术的目的在于提供一种字幕校准方法及装置，旨在解决由于现有技术中使用软件校准以句切分，无法进一步精确对准字幕，导致字幕校准精度低的问题。一方面，本专利技术提供了一种字幕校准方法，所述方法包括下述步骤：获取音视频数据和初始字幕数据；对所述音视频数据进行语音识别，确定音色对应的语音区间，根据所述语音区间生成带时间轴的第一字幕，并对所述音视频数据进行语音转换得到转换文本信息；依据所述初始字幕数据和/或所述转换文本信息对所述带时间轴的第一字幕进行校准，依据所述校准结果生成带时间轴的第二字幕。另一方面，本专利技术提供了一种字幕校准装置，所述装置包括：获取模块，用于获取音视频数据和初始字幕数据；识别模块，用于对所述获取模块获取的音视频数据进行语音识别，确定音色对应的语音区间，根据所述语音区间生成带时间轴的第一字幕，并对所述音视频数据进行语音转换得到转换文本信...
一种字幕对准方法及装置

【技术保护点】
一种字幕校准方法，其特征在于，所述方法包括下述步骤：获取音视频数据和初始字幕数据；对所述音视频数据进行语音识别，确定音色对应的语音区间，根据所述语音区间生成带时间轴的第一字幕，并对所述音视频数据进行语音转换得到转换文本信息；依据所述初始字幕数据和/或所述转换文本信息对所述带时间轴的第一字幕进行校准，依据所述校准结果生成带时间轴的第二字幕。

【技术特征摘要】
1.一种字幕校准方法，其特征在于，所述方法包括下述步骤：获取音视频数据和初始字幕数据；对所述音视频数据进行语音识别，确定音色对应的语音区间，根据所述语音区间生成带时间轴的第一字幕，并对所述音视频数据进行语音转换得到转换文本信息；依据所述初始字幕数据和/或所述转换文本信息对所述带时间轴的第一字幕进行校准，依据所述校准结果生成带时间轴的第二字幕。2.如权利要求1所述的方法，其特征在于，所述依据所述初始字幕数据和/或转换文本信息对所述带时间轴的第一字幕进行校准，依据所述校准结果生成带时间轴的第二字幕，包括：将所述初始字幕数据与所述带时间轴的第一字幕进行语音区间的校准；和/或将所述初始字幕数据与所述转换文本信息比对，依据所述比对结果与所述带时间轴的第一字幕进行字与字的校准。3.如权利要求1所述的方法，其特征在于，所述对所述音视频数据进行语音识别，确定音色对应的语音区间，生成带时间轴的第一字幕，并对所述音视频数据进行语音转换，得到转换文本信息，包括：识别所述音视频数据中包含的音色标识以及所述音色标识对应的语音区间，生成所述音色标识对应的字幕，所述带时间轴的第一字幕包括所述音色标识对应的字幕。4.如权利要求1所述的方法，其特征在于，所述对所述音视频数据进行语音识别，确定音色对应的语音区间，生成带时间轴的第一字幕，并对所述音视频数据进行语音转换得到转换文本信息，包括：计算所述音视频数据的能量和过零率，由所述计算结果确定所述语音区间；所述语音区间包括有声区间和无声区间。5.如权利要求1所述的方法，其特征在于，所述依据所述初始字幕数据和/或所述转换文本信息对所述带时间轴的第一字幕进行校准，依据所述校准结果生...

【专利技术属性】
技术研发人员：曹建中，
申请(专利权)人：广东小天才科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人