音频指纹的生成方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号：38345913 阅读：12 留言：0更新日期：2023-08-02 09:26

本申请适用于计算机技术领域，提供了一种音频指纹的生成方法、装置、电子设备和可读存储介质。其中，上述音频指纹的生成方法包括：获取目标时长的待处理媒体文件；根据待处理媒体文件，确定目标时长内人声部分所在的目标时间段；对目标时间段和目标时长内的其他时间段分别以不同的标识进行编码，得到音频指纹，音频指纹用于对媒体文件与其他文件进行匹配。本申请的实施例可以提高媒体文件与字幕文件进行匹配时的准确性。匹配时的准确性。匹配时的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
音频指纹的生成方法、装置、电子设备和可读存储介质

[0001]本申请属于计算机
，尤其涉及一种音频指纹的生成方法、装置、电子设备和可读存储介质。

技术介绍

[0002]字幕匹配是将字幕文件与音频、视频等媒体文件进行匹配的技术。通过字幕匹配，播放器可以在播放音频、视频的过程中为用户显示对应的字幕。
[0003]相关技术中，字幕匹配通常是通过字幕文件的名称、时长等属性信息与媒体文件的名称、时长等属性信息进行匹配的。一些情况下，用户可以对媒体文件的属性信息进行更改，导致将媒体文件与字幕文件进行匹配时准确性较低。

技术实现思路

[0004]本申请实施例提供一种音频指纹的生成方法、装置、电子设备和可读存储介质，可以解决相关技术中将媒体文件与字幕文件进行匹配时准确性较低的问题。
[0005]本申请实施例第一方面提供一种音频指纹的生成方法，包括：获取目标时长的待处理媒体文件；根据所述待处理媒体文件，确定所述目标时长内人声部分所在的目标时间段；对所述目标时间段和所述目标时长内的其他时间段分别以不同的标识进行编码，得到所述音频指纹，所述音频指纹用于对所述媒体文件与其他文件进行匹配。
[0006]本申请实施例第二方面提供的一种音频指纹的生成装置，包括：文件获取单元，用于获取目标时长的待处理媒体文件；时间段分析单元，用于根据所述待处理媒体文件，确定所述目标时长内人声部分所在的目标时间段；生成单元，用于对所述目标时间段和所述目标时长内的其他时间段分别以不同的标识进行编码，得到所述音频指纹，所述音...

【技术保护点】

【技术特征摘要】
1.一种音频指纹的生成方法，其特征在于，包括：获取目标时长的待处理媒体文件；根据所述待处理媒体文件，确定所述目标时长内人声部分所在的目标时间段；对所述目标时间段和所述目标时长内的其他时间段分别以不同的标识进行编码，得到所述音频指纹，所述音频指纹用于对所述待处理媒体文件与其他文件进行匹配。2.如权利要求1所述的音频指纹的生成方法，其特征在于，所述根据所述待处理媒体文件，确定所述目标时长内人声部分所在的目标时间段，包括：对所述待处理媒体文件进行解析，得到所述目标时长内各个采样点的振幅；根据每个所述采样点的振幅，确定所述目标时长内的所述目标时间段。3.如权利要求1所述的音频指纹的生成方法，其特征在于，所述根据所述待处理媒体文件，确定所述目标时长内人声部分所在的目标时间段，包括：对所述待处理媒体文件进行人声分离，得到人声部分的音频数据；根据所述音频数据，确定所述目标时长内的所述目标时间段。4.如权利要求3所述的音频指纹的生成方法，其特征在于，所述对所述待处理媒体文件进行人声分离，得到人声部分的音频数据，包括：对所述待处理媒体文件进行解码，得到初始调制数据，所述初始调制数据记录有每个所述采样点的振幅；对所述初始调制数据进行人声分离，得到所述音频数据。5.如权利要求4所述的音频指纹的生成方法，其特征在于，在所述对所述待处理媒体文件进行解码，得到初始调制数据之后，包括：对所述初始调制数据进行预处理，得到预处理后的调制数据，其中，所述预处理后的调制数据的采样频率、位深，以及振幅的幅值范围中的至少一项满足人声分离所需的分离条件；所述对所述待处理媒体文件进行人声分离，得到所述音频数据，包括：对所述预处理后的调制数据进行人声分离，得到所述音频数据。6....

【专利技术属性】
技术研发人员：易正宏，邓志明，
申请(专利权)人：迅雷计算机深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人