System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及音频脱敏领域,尤其涉及一种基于多路音源输入的广播终端。
技术介绍
1、多路音源输入的广播终端可以同时接收和处理多个音源输入的音频信号,并将音频信号传输至音频接收端,适用于广播电台、录音室、会议室、音乐制作和音频处理等领域,但是,随着音频信号的多路汇集,需要对音频信号进行脱敏处理,以满足转播需求,相关技术被人们所重视。
2、中国专利公开号:cn111210808a,公开了一种移动式黑广播监测系统及其监测方法,监测系统包括移动监测端、与所述移动监测端交互的语音识别服务器和人工监听核查终端,所述移动监测端主要由数字接收机、与所述数字接收机连接的天线、与所述数字接收机连接的监测设备构成。在人工监听之前,采用语音识别技术对含有黑广播关键词的音频进行筛选,在保证监测准确性的同时,极大缩减了人工监听的工作量。
3、但是,现有技术中还存在以下问题,
4、现有技术中,未考虑对与敏感关键词拼音相同但声调不同的特征关键词进行精准的敏感关键词判断,音频脱敏准确性不高。
技术实现思路
1、为此,本专利技术提供一种基于多路音源输入的广播终端,用以克服现有技术中未考虑对与敏感关键词拼音相同但声调不同的特征关键词进行精准的敏感关键词判断,音频脱敏准确性不高的问题。
2、为实现上述目的,本专利技术提供一种基于多路音源输入的广播终端,包括:
3、数据接收模块,其分别与若干音频输出端连接,用以接收各所述音频输出端发出的音频数据;
4、
5、数据分析模块,其分别与所述数据接收模块以及样本存储模块连接,用以接收所述数据接收模块的音频数据,并生成所述音频数据对应的文本数据后将所述文本数据与样本存储模块中的各敏感关键词进行对比,包括文本对比以及拼写信息对比,且,基于对比结果识别所述文本数据中的特征关键词,并划分特征关键词的类别;
6、播放模块,其与所述数据分析模块连接,包括筛选单元以及播放单元,
7、所述筛选单元用以确定第一类特征关键词对应音频段,将所述音频段进行消音处理后,将所述音频数据发送至播放单元;
8、且,所述筛选单元用以提取第二类特征关键词所在句子的句子结构与包含关联敏感关键词的若干样本语句的句子结构进行对比,并且,提取所述句子的非特征关键词,根据所述非特征关键词在各样本语句中的出现概率计算关联性参数,基于对比结果以及关联性参数判定是否对所述第二类特征关键词对应音频段进行消音处理,并将音频数据发送至播放单元;
9、所述播放单元用以将音频数据传输至音频播放端。
10、进一步地,所述数据分析模块将所述文本数据与样本存储模块中的各敏感关键词进行对比,基于对比结果识别所述文本数据中的特征关键词的过程包括,
11、所述数据分析模块进行文本对比,将所述文本数据分词处理后,将各分词与各所述敏感关键词进行对比;
12、且,所述数据分析模块进行拼写信息对比,将所述文本数据分词处理后将各分词的拼音字母与各所述敏感关键词的拼音字母进行对比;
13、若存在分词与任一敏感关键词相同或/和存在分词的拼音字母与任一敏感关键词的拼音字母相同,则将所述分词确定为特征关键词。
14、进一步地,所述数据分析模块划分特征关键词的类别的过程包括,
15、若满足预设对比条件,则所述数据分析模块判定所述特征关键词为第一类特征关键词;
16、若不满足预设对比条件,则所述数据分析模块判定所述特征关键词为第二类特征关键词;
17、所述预设对比条件为所述特征关键词与任一敏感关键词相同。
18、进一步地,所述筛选单元确定关联敏感关键词的过程包括,
19、所述筛选单元确定第二类特征关键词的拼音字母,将各所述敏感关键词的拼音字母与所述第二类特征关键词的拼音字母对比;
20、若存在敏感关键词的拼音字母与所述第二类特征关键词的拼音字母相同,则所述筛选单元确定所述敏感关键词为关联敏感关键词。
21、进一步地,所述筛选单元还用以提取第二类特征关键词所在句子的句子结构,并与各包含关联敏感关键词的若干样本语句的句子结构进行对比,判定第二类特征关键词是否为模糊敏感关键词,判定过程包括,
22、若所述第二类特征关键词所在句子的句子结构与任一所述样本语句的句子结构相同,则所述筛选单元判定所述第二类特征关键词为模糊敏感关键词。
23、进一步地,所述筛选单元根据所述非特征关键词在包含关联敏感关键词的样本语句中的出现概率计算关联性参数的过程包括,
24、所述筛选单元将所述非特征关键词进行分词处理,得到若干分词,并提取包含所述关联敏感关键词的样本语句,计算各所述分词在各所述样本语句中出现的概率,并根据公式(1)计算关联性参数,
25、
26、公式(1)中,e表示关联性参数,n表示包含所述关联敏感关键词的样本语句的数量,pi为第i个分词在各所述样本语句中出现的概率,i为大于0的整数。
27、进一步地,所述筛选单元基于对比结果以及关联性参数判定是否对所述第二类特征关键词对应音频段进行消音处理的过程包括,
28、所述筛选单元将所述关联性参数与预设的关联性参数阈值进行对比,
29、在预设消音条件下,所述筛选单元判定对所述第二类特征关键词对应音频段进行消音处理;
30、所述预设消音条件为,所述第二类特征关键词被判定为模糊敏感关键词且所述关联性参数大于所述关联性参数阈值。
31、进一步地,所述筛选单元对音频段进行消音处理的过程包括,
32、所述筛选单元内预设置有替换音频,所述筛选单元将所述替换音频替换所述音频段,以进行消音处理。
33、进一步地,所述筛选单元内设置有音频数据转换工具,用以将音频数据转换为文本数据。
34、进一步地,还包括存储模块,其与所述播放模块连接,用以存储播放单元传输的音频数据。
35、与现有技术相比,本专利技术通过数据分析模块将文本数据与样本存储模块中的各敏感关键词进行对比,基于对比结果识别文本数据中的特征关键词,并划分特征关键词的类别,筛选单元对于第一类特征关键词进行消音处理,提取第二类特征关键词所在句子的句子结构,进行句子结构对比并根据非特征关键词在各样本语句中的出现概率计算关联性参数,判定是否对第二类特征关键词对应音频段进行消音处理,本专利技术通过将与敏感关键词拼音相同但是音调不同的特征关键词结合所处句子的句子结构以及句子非特征关键词进行综合识别,减少由于声调不同对敏感关键词判定出错的情况,从而提升音频脱敏的准确性。
36、尤其,本专利技术通过数据分析模块将所述文本数据与样本存储模块中的各敏感关键词进行对比,其中,进行文本对比可以识别出确定的敏感关键词,通过拼写信息对比可以减少某本文档来自技高网...
【技术保护点】
1.一种基于多路音源输入的广播终端,其特征在于,包括:
2.根据权利要求1所述的基于多路音源输入的广播终端,其特征在于,所述数据分析模块识别所述文本数据中的特征关键词的过程包括,
3.根据权利要求2所述的基于多路音源输入的广播终端,其特征在于,所述数据分析模块划分特征关键词的类别的过程包括,
4.根据权利要求1所述的基于多路音源输入的广播终端,其特征在于,所述筛选单元确定关联敏感关键词的过程包括,
5.根据权利要求1所述的基于多路音源输入的广播终端,其特征在于,所述筛选单元还用以提取第二类特征关键词所在句子的句子结构,并与各包含关联敏感关键词的若干样本语句的句子结构进行对比,判定第二类特征关键词是否为模糊敏感关键词,判定过程包括,
6.根据权利要求5所述的基于多路音源输入的广播终端,其特征在于,所述筛选单元根据所述非特征关键词在包含关联敏感关键词的样本语句中的出现概率计算关联性参数的过程包括,
7.根据权利要求6所述的基于多路音源输入的广播终端,其特征在于,所述筛选单元基于对比结果以及关联性参数判定是否对所述
8.根据权利要求1所述的基于多路音源输入的广播终端,其特征在于,所述筛选单元对音频段进行消音处理的过程包括,
9.根据权利要求1所述的基于多路音源输入的广播终端,其特征在于,所述筛选单元内设置有音频数据转换工具,用以将音频数据转换为文本数据。
10.根据权利要求1所述的基于多路音源输入的广播终端,其特征在于,还包括存储模块,其与所述播放模块连接,用以存储播放单元传输的音频数据。
...【技术特征摘要】
1.一种基于多路音源输入的广播终端,其特征在于,包括:
2.根据权利要求1所述的基于多路音源输入的广播终端,其特征在于,所述数据分析模块识别所述文本数据中的特征关键词的过程包括,
3.根据权利要求2所述的基于多路音源输入的广播终端,其特征在于,所述数据分析模块划分特征关键词的类别的过程包括,
4.根据权利要求1所述的基于多路音源输入的广播终端,其特征在于,所述筛选单元确定关联敏感关键词的过程包括,
5.根据权利要求1所述的基于多路音源输入的广播终端,其特征在于,所述筛选单元还用以提取第二类特征关键词所在句子的句子结构,并与各包含关联敏感关键词的若干样本语句的句子结构进行对比,判定第二类特征关键词是否为模糊敏感关键词,判定过程包括,
6.根据权利要求5所述的基于多路...
【专利技术属性】
技术研发人员:明德,阮胜林,黄小强,朱正辉,张常华,
申请(专利权)人:广东保伦电子股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。