音频广告检测的方法及系统、终端以及计算机可读存储介质技术方案

技术编号：18445076 阅读：38 留言：0更新日期：2018-07-14 10:26

本发明专利技术提出一种音频广告检测的方法及系统、终端以及计算机可读存储介质。该音频广告检测的方法包括：获取音频资源；将所述音频资源进行切分，以形成多个音频单元；将所述音频单元进行语音识别，以识别出文字文本；检测所述文字文本中是否包含广告关键字，以确定所述音频单元中是否含有广告；以及将所述音频单元的检测结果进行分析并输出，以确定广告的类型和广告的位置。通过本发明专利技术的音频广告检测的方法，可以简单地、高精度地检测出音频资源中的广告。

Audio advertisement detection method and system, terminal and computer readable storage medium

The invention proposes a method and system for audio advertisement detection, a terminal and a computer readable storage medium. The audio advertisement detection method includes: obtaining the audio resource; dividing the audio resource to form a plurality of audio units; making the audio unit to recognize the speech text to identify the text text; detect whether the text contains the advertising keyword in order to determine whether the audio unit contains a wide range. Report and analyze the output of the audio unit and output it to determine the type of advertisement and the location of the advertisement. By means of the audio advertisement detection method of the invention, advertisements in audio resources can be detected simply and accurately.

全部详细技术资料下载

【技术实现步骤摘要】
音频广告检测的方法及系统、终端以及计算机可读存储介质
本专利技术涉及通信
，尤其涉及一种音频广告检测的方法及系统、终端以及计算机可读存储介质。
技术介绍
随着互联网的发展与普及，互联网上积累了大量的信息，其中包括大量语音类的音频信息。而在这些语音类的音频信息中，很多会带有广告。当用户进行音频点播时，带有广告的音频会很大程度上影响用户的点播体验。例如，在故事机产品中，其核心功能就是根据用户的语音点播返回指定的故事音频。故事机的故事音频数据库共有数千个专辑，包含了数十万的音频。但是，音频的质量参差不齐，其中还有大量的音频包含着第三方的广告信息。如果用户使用故事机进行点播的时候，给用户播放了这类“低质量”的带广告的故事资源，势必会给用户造成不好的点播体验。因此，如何能够在数据入库的时候，快速的筛选出带有广告的音频，是大家十分关注的问题。
技术实现思路
本专利技术实施例提供一种音频广告检测的方法、系统和终端，以解决现有技术中的以上的一个或多个技术问题，或至少提供一种有益的选择。第一方面，本专利技术实施例提供了一种音频广告检测的方法，所述方法包括：获取音频资源；将所述音频资源进行切分，以形成多个音频单元；将所述音频单元进行语音识别，以识别出文字文本；检测所述文字文本中是否包含广告关键字，以确定所述音频单元中是否含有广告；以及将所述音频单元的检测结果进行分析并输出，以确定广告的类型和广告的位置。结合第一方面，本专利技术在第一方面的第一种实施方式中，所述方法还包括：在将所述音频资源进行切分后，截取处于所述音频资源开始部分和结尾部分的音频单元，以进行语音识别。优选地，所...

【技术保护点】
1.一种音频广告检测的方法，其特征在于，所述方法包括：获取音频资源；将所述音频资源进行切分，以形成多个音频单元；将所述音频单元进行语音识别，以识别出文字文本；检测所述文字文本中是否包含广告关键字，以确定所述音频单元中是否含有广告；以及将所述音频单元的检测结果进行分析并输出，以确定广告的类型和广告的位置。

【技术特征摘要】
1.一种音频广告检测的方法，其特征在于，所述方法包括：获取音频资源；将所述音频资源进行切分，以形成多个音频单元；将所述音频单元进行语音识别，以识别出文字文本；检测所述文字文本中是否包含广告关键字，以确定所述音频单元中是否含有广告；以及将所述音频单元的检测结果进行分析并输出，以确定广告的类型和广告的位置。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：在将所述音频资源进行切分后，截取处于所述音频资源开始部分和结尾部分的音频单元，以进行语音识别。3.根据权利要求2所述的方法，其特征在于，所述开始部分和所述结尾部分的时长为60秒。4.根据权利要求3所述的方法，其特征在于，所述检测所述文字文本中是否包含广告关键字，以确定所述音频单元中是否含有广告，包括：检测所述文字文本中是否包含广告关键字库中的广告关键字，以确定所述音频单元中是否含有广告；其中，所述广告关键字库预先建立并存储。5.根据权利要求1－4任一项权利要求所述的方法，其特征在于，在将所述音频资源进行切分，以形成多个音频单元之前，所述方法还包括：将所获取到的所述音频资源进行格式转换。6.根据权利要求5所述的方法，其特征在于，所述方法包括：根据广告的类型和广告的位置，对各个音频资源的优先级进行排序。7.一种音频广告检测的系统，其特征在于，所述系统包括：音频获取单元，配置用于获取音频资源；音频切分单元，配置用于将所述音频资源进行切分，以形成多个音频单元；语音识别单...

【专利技术属性】
技术研发人员：陆永帅，罗荣刚，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人