一种音频敏感信息自动屏蔽方法、装置、设备及存储介质制造方法及图纸

技术编号：37450062 阅读：21 留言：0更新日期：2023-05-06 09:21

本发明专利技术提供了一种音频敏感信息自动屏蔽方法、装置、设备及存储介质，其中方法包括导入音频文件并解析；其中，音频文件包括纯音频源文件或具备音频的成品视频源文件；将所述源文件的全量音频输入角色特征音频计算模型进行角色区分；其中，角色区分通过角色的发声特征进行区分；将所述源文件拆条，按语句、词语以及语音连贯度进行拆分，并对拆分后的段落音频进行语音识别；进行敏感度计算，根据发音和语义甄别所述语音识别到的敏感词汇；将甄别到的敏感词汇的音频文件条中添加覆盖音。本发明专利技术所述的一种音频敏感信息自动屏蔽方法，可为内容生产者、内容运营人员提一种可以为影视内容提供音频自动脱敏的服务，解决人工编辑效率低下等问题。问题。问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种音频敏感信息自动屏蔽方法、装置、设备及存储介质

[0001]本专利技术属于音频处理领域，尤其是涉及一种音频敏感信息自动屏蔽方法、装置、设备及存储介质。

技术介绍

[0002]现阶段电视机用户看到的影视视频内容可涵盖不同类型、不同国家、不同语言，影视业务内容投放也具备大量的节目资源，对于节目音频脱敏的运营工作来讲具有不小的工作体量。不同国家、不同地区的语种节目在视频录制中不会对粗口、脏话等进行识别并处理，一般会有整段减掉原片的情况，从而照成内容不够充实。有时可能会照成故事线中断，影响观众收视体验。因此，现有的处理方法存在处理效率低，处理效果不佳的问题。

技术实现思路

[0003]有鉴于此，本专利技术旨在提出一种音频敏感信息自动屏蔽方法、装置、设备及存储介质，以解决现有音频处理方法处理效率不佳的问题。
[0004]为达到上述目的，本专利技术的技术方案是这样实现的：
[0005]第一方面，本专利技术提供了一种音频敏感信息自动屏蔽方法，包括：
[0006]导入音频文件并解析；其中，音频文件包括纯音频源文件或具备音频的成品视频源文件；
[0007]将所述源文件的全量音频输入角色特征音频计算模型进行角色区分；其中，角色区分通过角色的发声特征进行区分；
[0008]将所述源文件拆条，按语句、词语以及语音连贯度进行拆分，并对拆分后的段落音频进行语音识别；
[0009]进行敏感度计算，根据发音和语义甄别所述语音识别到的敏感词汇；
[0010]将甄别到的敏感词汇...

【技术保护点】

【技术特征摘要】
1.一种音频敏感信息自动屏蔽方法，其特征在于，包括：导入音频文件并解析；其中，音频文件包括纯音频源文件或具备音频的成品视频源文件；将所述源文件的全量音频输入角色特征音频计算模型进行角色区分；其中，角色区分通过角色的发声特征进行区分；将所述源文件拆条，按语句、词语以及语音连贯度进行拆分，并对拆分后的段落音频进行语音识别；进行敏感度计算，根据发音和语义甄别所述语音识别到的敏感词汇；将甄别到的敏感词汇的音频文件条中添加覆盖音。2.根据权利要求1所述的方法，其特征在于：所述发声特征包括音色、语调、节奏、发音、语种、方言、以及口音。3.根据权利要求1所述的方法，其特征在于，所述将所述源文件拆条，按语句、词语以及语音连贯度进行拆分，并对拆分后的段落音频进行语音识别，包括：解析所述源文件中音频；以语句、词语及发音进行段落拆分并标记时间戳节点；将拆分后的段落音频按角色区分进行语音识别。4.根据权利要求1所述的方法，其特征在于，在所述将甄别到的敏感词汇的音频文件条中添加覆盖音后，所述方法还包括：存储处理后的音频文件。5.一种音频敏感信息自动屏蔽装置，其特征在于，包括：...

【专利技术属性】
技术研发人员：王钦硕，程霈，吴磊，王宇，王利斌，芦静，
申请(专利权)人：爱信诺征信有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人