一种用于管理音频数据的方法、设备和计算机存储介质技术

技术编号：24041635 阅读：51 留言：0更新日期：2020-05-07 03:36

本公开的实施例涉及用于管理音频数据的方法、设备和计算机存储介质。在一个实施例中，提出了一种用于管理音频数据的方法。该方法包括：获取文本敏感词的标准语音波形；基于与干扰因素相对应的语音数据，获得该标准语音波形的至少一个扩展语音波形，其中该至少一个扩展语音波形和该标准语音波形形成与该文本敏感词相对应的敏感词语音波形组；在直播间的直播期间，缓存该直播间的用户在最近的第一时间段期间的目标音频；获取该目标音频的音频波形；响应于确定该音频波形中存在与该敏感词语音波形组中的波形相匹配的部分，增加该直播间的敏感度值；以及响应于该直播间的该敏感度值达到敏感度阈值，针对该直播间执行屏蔽动作。

A method, device and computer storage medium for managing audio data

全部详细技术资料下载

【技术实现步骤摘要】
一种用于管理音频数据的方法、设备和计算机存储介质
本公开的实施例涉及音频处理领域，并且更具体地涉及用于管理音频数据、尤其是用于管理网络直播间中的音频数据的方法、设备和计算机存储介质。
技术介绍
随着即时网络通信技术和智能手机的持续迅猛发展，出现了众多拥有网络直播功能的PC端和手机端的应用。由于网络直播能够极大地促进用户之间的沟通和互动，因此已经在娱乐休闲、远程教学、商务推广等方面得到了广泛使用。为了防止不良言论在大量用户中的传播，需要针对直播中的各种内容执行监测。然而，通常需要大量的后台管理员或审核员对直播数据进行人工监测，以便及时屏蔽违规内容或进行封禁处理等，直播中的语音监测在拥有众多直播数据的应用平台上难以高效地进行。此外，虽然目前已经提出了针对视频中的音频数据进行自动识别以检测是否包含敏感词汇的实现方案，但是这些方案往往无法对存在方言口音、语调、情感等干扰因素的音频数据进行准确的判断，因而降低了识别的命中率。
技术实现思路
本公开的实施例提供一种用于自动且准确地管理音频数据的方案。根...

【技术保护点】
1.一种用于管理音频数据的方法，包括：/n获取文本敏感词的标准语音波形；/n基于与干扰因素相对应的语音数据，获得所述标准语音波形的至少一个扩展语音波形，其中所述至少一个扩展语音波形和所述标准语音波形形成与所述文本敏感词相对应的敏感词语音波形组；/n在直播间的直播期间，缓存所述直播间的用户在最近的第一时间段期间的目标音频；/n获取所述目标音频的音频波形；/n响应于确定所述音频波形中存在与所述敏感词语音波形组中的波形相匹配的部分，增加所述直播间的敏感度值；以及/n响应于所述直播间的所述敏感度值达到敏感度阈值，针对所述直播间执行屏蔽动作；/n其中所述干扰因素包括以下中的至少任一项：方言口音、语调、语...

【技术特征摘要】
1.一种用于管理音频数据的方法，包括：
获取文本敏感词的标准语音波形；
基于与干扰因素相对应的语音数据，获得所述标准语音波形的至少一个扩展语音波形，其中所述至少一个扩展语音波形和所述标准语音波形形成与所述文本敏感词相对应的敏感词语音波形组；
在直播间的直播期间，缓存所述直播间的用户在最近的第一时间段期间的目标音频；
获取所述目标音频的音频波形；
响应于确定所述音频波形中存在与所述敏感词语音波形组中的波形相匹配的部分，增加所述直播间的敏感度值；以及
响应于所述直播间的所述敏感度值达到敏感度阈值，针对所述直播间执行屏蔽动作；
其中所述干扰因素包括以下中的至少任一项：方言口音、语调、语速、性别、以及情感。

2.根据权利要求1所述的方法，其中获得所述标准语音波形的所述至少一个扩展语音波形包括：
提取所述语音数据的特征值；以及
基于所述特征值对所述标准语音波形进行训练，以获取所述至少一个扩展语音波形。

3.根据权利要求1所述的方法，其中确定所述音频波形中存在与所述敏感词语音波形组中的波形相匹配的部分包括：
从所述音频波形中提取特征值；
确定所提取的特征值与所述敏感词语音波形组中的波形的所述特征值之间的相似度；以及
响应于所述相似度高于相似度阈值，确定所述音频波形中存在与所述敏感词语音波形组中的波形相匹配的部分。

4.根据权利要求1所述的方法，进一步包括：从文本敏感词词库中获取所述文本敏感词。

5.根据权利要求1所述的方法，进一步包括：
响应于所述敏感度值未达到敏感度阈值，播放被缓存的所述目标音频。

6.根据权利要求5所述的方法，其中播放被缓存的所述目标音频包括：
将所述目标音频延迟第二时间段后播放所述目标音频，所述第二时间段大于所述第一时间段。

7.根据权利要求1所述的方法，其中增加所述敏感度值包括：
按照与所述文本敏感词相关联的预定步长，增加所述敏感度值。

8.根据权利要求1所述的方法，其中针对所述直播间执行屏蔽动作包括以下中的至少任一项：
替换所述目标音频中的与所述敏感词语音波形组中的波形相匹配的部分；
向所述用户发送警告；
禁止所述用户在所述直播间内发言；
禁止所述直播间的所有音频；以及
向所述直播间的管理员发送通知。

9.根据权利要求1所述的方法，其中所述敏感度阈值与所述用户的信用等级相关联。

10.根据权利要求9所述的方法，其中所述信用等级取决于以下中的至少任一项：
所述用户的历史直播记录、所述用户的先前信用等级、所述用户被其他用户有效举报的记录以及所述用户的受处罚记录。

11.一种用于管理音频数据的设备，包括：
至少一个处理单元；
至少一个存储器，所述至少一个存储器被耦合到所述至少一个处理单元并且存储用于由所述至少一个处理单元执行的指令，所述指令当由所述至少...

【专利技术属性】
技术研发人员：赵斯禹，
申请(专利权)人：北京默契破冰科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人