音频处理方法、装置、设备及存储介质制造方法及图纸

技术编号:38704085 阅读:18 留言:0更新日期:2023-09-08 14:44
本发明专利技术涉及音频处理技术领域,尤其涉及一种音频处理方法、装置、设备及存储介质,该方法包括:通过接收终端设备发送的待播放音频文件,并根据待播放音频文件获取对应的待播放内容以及播放时间;对待播放内容进行人声提取,并根据提取结果获得对应的文字信息;对文字信息进行语义识别,判断文字信息是否为预设消音信息;若是,则根据文字信息和播放时间生成对应的消音指令,并将消音指令发送至终端设备,以使终端设备根据消音指令对待播放音频文件进行消音后播放。由于本发明专利技术可对待直播音频文件进行语义识别,并根据识别到的预设消音信息生成消音指令,以使终端设备在对待直播音频文件进行消音后播放,可自动消除不良音频,提升用户观看体验。用户观看体验。用户观看体验。

【技术实现步骤摘要】
音频处理方法、装置、设备及存储介质


[0001]本专利技术涉及音频处理
,尤其涉及一种音频处理方法、装置、设备及存储介质。

技术介绍

[0002]目前,随着科技的发展,自媒体直播孕育而生,但由于部分直播都是实时的,且部分主播的能力和素质参差不齐,进而会导致用户在观看实时直播时可能会观看到部分不良信息,例如粗口,各种挑衅,甚至是一些违规,违法犯罪的言论,影响用户观看体验。
[0003]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。

技术实现思路

[0004]本专利技术的主要目的在于提供了一种音频处理方法、装置、设备及存储介质,旨在解决现有在实时直播时容易将部分主播的不良行为传播给用户,影响用户观看体验的技术问题。
[0005]为实现上述目的,本专利技术提供了一种音频处理方法,所述方法包括以下步骤:
[0006]接收终端设备发送的待播放音频文件,并根据所述待播放音频文件获取对应的待播放内容以及播放时间;
[0007]对所述待播放内容进行人声提取,并根据提取结果获得对应的文字信息;
[0008]对所述文字信息进行语义识别,判断所述文字信息是否为预设消音信息;
[0009]若是,则根据所述文字信息和所述播放时间生成对应的消音指令,并将所述消音指令发送至所述终端设备,以使所述终端设备根据所述消音指令对所述待播放音频文件进行消音后播放。
[0010]可选地,所述判断所述文字信息是否为预设消音信息的步骤,包括:
[0011]判断所述文字信息是否为预设不良信息;
[0012]相应地,所述若是,则根据所述文字信息和所述播放时间生成对应的消音指令,并将所述消音指令发送至所述终端设备,以使所述终端设备根据所述消音指令对所述待播放音频文件进行消音后播放的步骤,包括:
[0013]若是,则根据所述文字信息和所述播放时间生成对应的部分消音指令,并将所述部分消音指令发送至所述终端设备,以使所述终端设备根据所述部分消音指令对所述待播放音频文件进行部分消音后播放。
[0014]可选地,所述根据所述文字信息和所述播放时间生成对应的部分消音指令,并将所述部分消音指令发送至所述终端设备的步骤,包括:
[0015]根据所述文字信息和所述播放时间确定消音时刻和消音时长;
[0016]基于所述消音时刻和所述消音时长生成对应的部分消音指令,并将所述部分消音指令发送至所述终端设备。
[0017]可选地,所述判断所述文字信息是否为预设消音信息的步骤,包括:
[0018]判断所述文字信息是否为预设违法信息;
[0019]相应地,所述若是,则根据所述文字信息和所述播放时间生成对应的消音指令,并将所述消音指令发送至所述终端设备,以使所述终端设备根据所述消音指令对所述待播放音频文件进行消音后播放的步骤,包括:
[0020]若是,则根据所述文字信息和所述播放时间生成对应的完全消音指令,并将所述完全消音指令发送至所述终端设备,以使所述终端设备根据所述完全消音指令对所述待播放音频文件进行完全消音后播放。
[0021]可选地,所述接收终端设备发送的待播放音频文件的步骤,包括:
[0022]接收终端设备发送的音频片段文件,并将所述音频片段文件作为待播放音频文件,所述音频片段文件为所述终端设备根据直播音频文件按照预设时长进行切片获得的文件。
[0023]可选地,所述根据所述待播放音频文件获取对应的待播放内容以及播放时间的步骤,包括:
[0024]根据所述待播放音频文件获取对应的时间戳;
[0025]基于所述时间戳从所述待播放音频文件中提取对应的待播放内容以及播放时间。
[0026]可选地,所述根据所述文字信息和所述播放时间确定消音时刻和消音时长的步骤之前,还包括:
[0027]将所述文字信息和所述播放时间存储至预设数据库中;
[0028]相应地,所述根据所述文字信息和所述播放时间确定消音时刻和消音时长的步骤,包括:
[0029]在所述文字信息语义识别完成时,根据所述预设数据中存储的文字信息和播放时间确定消音时刻和消音时长。
[0030]此外,为实现上述目的,本专利技术还提出一种音频处理装置,所述装置包括:
[0031]文件接收模块,用于接收终端设备发送的待播放音频文件,并根据所述待播放音频文件获取对应的待播放内容以及播放时间;
[0032]人声提取模块,用于对所述待播放内容进行人声提取,并根据提取结果获得对应的文字信息;
[0033]语义识别模块,用于对所述文字信息进行语义识别,判断所述文字信息是否为预设消音信息;
[0034]指令发送模块,用于若是,则根据所述文字信息和所述播放时间生成对应的消音指令,并将所述消音指令发送至所述终端设备,以使所述终端设备根据所述消音指令对所述待播放音频文件进行消音。
[0035]此外,为实现上述目的,本专利技术还提出一种音频处理设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音频处理程序,所述音频处理程序配置为实现如上文所述的音频处理方法的步骤。
[0036]此外,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有音频处理程序,所述音频处理程序被处理器执行时实现如上文所述的音频处理方法的步骤。
[0037]本专利技术是通过接收终端设备发送的待播放音频文件,并根据所述待播放音频文件
获取对应的待播放内容以及播放时间;对所述待播放内容进行人声提取,并根据提取结果获得对应的文字信息;对所述文字信息进行语义识别,判断所述文字信息是否为预设消音信息;若是,则根据所述文字信息和所述播放时间生成对应的消音指令,并将所述消音指令发送至所述终端设备,以使所述终端设备根据所述消音指令对所述待播放音频文件进行消音后播放。由于本专利技术可对待直播音频文件进行语义识别,并根据识别到的预设消音信息生成消音指令,以使终端设备在对待直播音频文件进行消音后播放。相比于现有的直接播放待直播音频文件,本专利技术可自动消除不良音频,提升用户观看体验。
附图说明
[0038]图1为本专利技术实施例方案涉及的硬件运行环境的音频处理设备结构示意图;
[0039]图2为本专利技术音频处理方法第一实施例的流程示意图;
[0040]图3为本专利技术音频处理方法第二实施例的流程示意图;
[0041]图4为本专利技术音频处理装置第一实施例的结构框图。
[0042]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0043]应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。
[0044]参照图1,图1为本专利技术实施例方案涉及的硬件运行环境的音频处理设备结构示意图。
[0045]如图1所示,该音频处理设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CP本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法,其特征在于,所述方法包括以下步骤:接收终端设备发送的待播放音频文件,并根据所述待播放音频文件获取对应的待播放内容以及播放时间;对所述待播放内容进行人声提取,并根据提取结果获得对应的文字信息;对所述文字信息进行语义识别,判断所述文字信息是否为预设消音信息;若是,则根据所述文字信息和所述播放时间生成对应的消音指令,并将所述消音指令发送至所述终端设备,以使所述终端设备根据所述消音指令对所述待播放音频文件进行消音后播放。2.如权利要求1所述的音频处理方法,其特征在于,所述判断所述文字信息是否为预设消音信息的步骤,包括:判断所述文字信息是否为预设不良信息;相应地,所述若是,则根据所述文字信息和所述播放时间生成对应的消音指令,并将所述消音指令发送至所述终端设备,以使所述终端设备根据所述消音指令对所述待播放音频文件进行消音后播放的步骤,包括:若是,则根据所述文字信息和所述播放时间生成对应的部分消音指令,并将所述部分消音指令发送至所述终端设备,以使所述终端设备根据所述部分消音指令对所述待播放音频文件进行部分消音后播放。3.如权利要求2所述的音频处理方法,其特征在于,所述根据所述文字信息和所述播放时间生成对应的部分消音指令,并将所述部分消音指令发送至所述终端设备的步骤,包括:根据所述文字信息和所述播放时间确定消音时刻和消音时长;基于所述消音时刻和所述消音时长生成对应的部分消音指令,并将所述部分消音指令发送至所述终端设备。4.如权利要求1至3中任一项所述的音频处理方法,其特征在于,所述判断所述文字信息是否为预设消音信息的步骤,包括:判断所述文字信息是否为预设违法信息;相应地,所述若是,则根据所述文字信息和所述播放时间生成对应的消音指令,并将所述消音指令发送至所述终端设备,以使所述终端设备根据所述消音指令对所述待播放音频文件进行消音后播放的步骤,包括:若是,则根据所述文字信息和所述播放时间生成对应的完全消音指令,并将所述完全消音指令发送至所述终端设备,以使所述终端设备根据所述完全消音指令对所述...

【专利技术属性】
技术研发人员:邓鹏
申请(专利权)人:深圳市九洲电器有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1