音频广告检测的方法及系统、终端以及计算机可读存储介质技术方案

技术编号:18445076 阅读:38 留言:0更新日期:2018-07-14 10:26
本发明专利技术提出一种音频广告检测的方法及系统、终端以及计算机可读存储介质。该音频广告检测的方法包括:获取音频资源;将所述音频资源进行切分,以形成多个音频单元;将所述音频单元进行语音识别,以识别出文字文本;检测所述文字文本中是否包含广告关键字,以确定所述音频单元中是否含有广告;以及将所述音频单元的检测结果进行分析并输出,以确定广告的类型和广告的位置。通过本发明专利技术的音频广告检测的方法,可以简单地、高精度地检测出音频资源中的广告。

Audio advertisement detection method and system, terminal and computer readable storage medium

The invention proposes a method and system for audio advertisement detection, a terminal and a computer readable storage medium. The audio advertisement detection method includes: obtaining the audio resource; dividing the audio resource to form a plurality of audio units; making the audio unit to recognize the speech text to identify the text text; detect whether the text contains the advertising keyword in order to determine whether the audio unit contains a wide range. Report and analyze the output of the audio unit and output it to determine the type of advertisement and the location of the advertisement. By means of the audio advertisement detection method of the invention, advertisements in audio resources can be detected simply and accurately.

【技术实现步骤摘要】
音频广告检测的方法及系统、终端以及计算机可读存储介质
本专利技术涉及通信
,尤其涉及一种音频广告检测的方法及系统、终端以及计算机可读存储介质。
技术介绍
随着互联网的发展与普及,互联网上积累了大量的信息,其中包括大量语音类的音频信息。而在这些语音类的音频信息中,很多会带有广告。当用户进行音频点播时,带有广告的音频会很大程度上影响用户的点播体验。例如,在故事机产品中,其核心功能就是根据用户的语音点播返回指定的故事音频。故事机的故事音频数据库共有数千个专辑,包含了数十万的音频。但是,音频的质量参差不齐,其中还有大量的音频包含着第三方的广告信息。如果用户使用故事机进行点播的时候,给用户播放了这类“低质量”的带广告的故事资源,势必会给用户造成不好的点播体验。因此,如何能够在数据入库的时候,快速的筛选出带有广告的音频,是大家十分关注的问题。
技术实现思路
本专利技术实施例提供一种音频广告检测的方法、系统和终端,以解决现有技术中的以上的一个或多个技术问题,或至少提供一种有益的选择。第一方面,本专利技术实施例提供了一种音频广告检测的方法,所述方法包括:获取音频资源;将所述音频资源进行切分,以形成多个音频单元;将所述音频单元进行语音识别,以识别出文字文本;检测所述文字文本中是否包含广告关键字,以确定所述音频单元中是否含有广告;以及将所述音频单元的检测结果进行分析并输出,以确定广告的类型和广告的位置。结合第一方面,本专利技术在第一方面的第一种实施方式中,所述方法还包括:在将所述音频资源进行切分后,截取处于所述音频资源开始部分和结尾部分的音频单元,以进行语音识别。优选地,所述开始部分和所述结尾部分的时长为60秒。结合第一方面、第一方面的第一种实施方式,本专利技术在第一方面的第二种实施方式中,所述检测所述文字文本中是否包含广告关键字,以确定所述音频单元中是否含有广告,包括:检测所述文字文本中是否包含广告关键字库中的广告关键字,以确定所述音频单元中是否含有广告;其中,所述广告关键字库预先建立并存储。结合第一方面、第一方面的第一种实施方式和第一方面的第二种实施方式,本专利技术在第一方面的第三种实施方式中,在将所述音频资源进行切分,以形成多个音频单元之前,所述方法还包括:将所获取到的所述音频资源进行格式转换。结合第一方面及任一种实施方式,本专利技术在第一方面的第四种实施方式中,所述方法包括:根据广告的类型和广告的位置,对各个音频资源的优先级进行排序。第二方面,本专利技术实施例提供了一种音频广告检测的系统,包括:音频获取单元,配置用于获取音频资源;音频切分单元,配置用于将所述音频资源进行切分,以形成多个音频单元;语音识别单元,配置用于将所述音频单元进行语音识别,以识别出文字文本;广告检测单元,配置用于检测所述文字文本中是否包含广告关键字,以确定所述音频单元中是否含有广告;以及分析输出单元,配置用于将所述音频单元的检测结果进行分析并输出,以确定广告的类型和广告的位置。结合第二方面,本专利技术在第二方面的第一种实施方式中,所述系统还包括:音频截取单元,配置用于在将所述音频资源进行切分后,截取处于所述音频资源开始部分和结尾部分的音频单元,以进行语音识别;其中,所述开始部分和所述结尾部分的时长为60秒。优选地,所述广告关键字存储在广告关键字库中;其中,所述广告关键字库预先建立并存储。结合第二方面和第二方面的第一种实施方式,本专利技术在第二方面的第二种实施方式中,所述系统还包括:格式转换单元,配置用于在将所述音频资源进行切分之前,将所获取到的所述音频资源进行格式转换。结合第二方面及任一种实施方式中,所述系统还包括:音频排序单元,配置用于根据广告的类型和广告的位置,对各个音频资源的优先级进行排序。第三方面,本专利技术实施例提供了一种音频广告检测的终端,所述终端包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述任一所述的方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现上述第一方面中任一种所述音频广告检测的方法。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。上述技术方案中的一个技术方案具有如下优点或有益效果:通过本专利技术的音频广告检测的方法,可以简单地、高精度地检测出音频资源中的广告。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1示出了根据本专利技术一个实施例的音频广告检测的方法100的流程图;图2示出了根据本专利技术另一个实施例的音频广告检测的方法200的流程图;图3示出了根据本专利技术另一个实施例的音频广告检测的方法300的流程图;图3a示出了根据本专利技术另一个实施例的音频广告检测的方法303的流程图;图4示出了根据本专利技术一个实施例的音频广告检测的系统400的结构框图;图5示出了根据本专利技术另一个实施例的音频广告检测的系统500的结构框图;图6示出了根据本专利技术另一个实施例的音频广告检测的系统600的结构框图;图6a示出了根据本专利技术另一个实施例的音频广告检测的系统606的结构框图;以及图7示出了根据本专利技术的音频广告检测的终端的示意图。具体实施方式在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。下面结合图1至图7所示,对本专利技术的音频广告检测的方法、系统和终端进行描述。参见图1所示,本专利技术一个实施例的音频广告检测的方法100,包括步骤S101至步骤S105。首先,通过音频获取步骤S101,获取音频资源。接着,进入音频切分步骤S102,将音频资料进行切分,以形成多个音频单元。在一种实施例中,可以采用音频处理工具,按照时间,将音频资源切分成多个音频单元。然后,通过语音识别步骤S103,将音频单元进行语音识别,以识别出文字文本。在一种实施例中,可以采用语音识别程序,对音频单元进行从语音到文字的识别和转换,从而,形成文字文本。通过广告检测步骤S104,检测文字文本中是否包含广告关键字,以确定所述音频单元中是否含有广告。优选地,广告关键字存储在广告关键字库中,其中,所述广告关键字库预先建立并存储。在一种实施例中,广告关键字包括但不限于:“微信”,“应用商店”,“公众号”,“app”等。最后,通过分析输出步骤S105,将音频单元的检测结果进行分析并输出,以确定广告的类型和广告的位置。在一种实施例中,在步骤S105中,可以根据广告关键词的分类不同,而将广告分析为不同的类型。并且,由于音频资源按照时间进行切分,切分后的音频单元对应音频资料的不同时长的位置,因而,当确定某一音频单元中包含广告本文档来自技高网...

【技术保护点】
1.一种音频广告检测的方法,其特征在于,所述方法包括:获取音频资源;将所述音频资源进行切分,以形成多个音频单元;将所述音频单元进行语音识别,以识别出文字文本;检测所述文字文本中是否包含广告关键字,以确定所述音频单元中是否含有广告;以及将所述音频单元的检测结果进行分析并输出,以确定广告的类型和广告的位置。

【技术特征摘要】
1.一种音频广告检测的方法,其特征在于,所述方法包括:获取音频资源;将所述音频资源进行切分,以形成多个音频单元;将所述音频单元进行语音识别,以识别出文字文本;检测所述文字文本中是否包含广告关键字,以确定所述音频单元中是否含有广告;以及将所述音频单元的检测结果进行分析并输出,以确定广告的类型和广告的位置。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在将所述音频资源进行切分后,截取处于所述音频资源开始部分和结尾部分的音频单元,以进行语音识别。3.根据权利要求2所述的方法,其特征在于,所述开始部分和所述结尾部分的时长为60秒。4.根据权利要求3所述的方法,其特征在于,所述检测所述文字文本中是否包含广告关键字,以确定所述音频单元中是否含有广告,包括:检测所述文字文本中是否包含广告关键字库中的广告关键字,以确定所述音频单元中是否含有广告;其中,所述广告关键字库预先建立并存储。5.根据权利要求1-4任一项权利要求所述的方法,其特征在于,在将所述音频资源进行切分,以形成多个音频单元之前,所述方法还包括:将所获取到的所述音频资源进行格式转换。6.根据权利要求5所述的方法,其特征在于,所述方法包括:根据广告的类型和广告的位置,对各个音频资源的优先级进行排序。7.一种音频广告检测的系统,其特征在于,所述系统包括:音频获取单元,配置用于获取音频资源;音频切分单元,配置用于将所述音频资源进行切分,以形成多个音频单元;语音识别单...

【专利技术属性】
技术研发人员:陆永帅罗荣刚
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1