【技术实现步骤摘要】
一种数据处理方法、装置和用于数据处理的装置
本专利技术涉及计算机
,尤其涉及一种数据处理方法、装置和用于数据处理的装置。
技术介绍
在用户的日常自然言语中,会出现哈欠、掌声、笑声等非文字类的音频事件,对语音数据进行音频事件检测,在语音处理领域具有重要意义。通过对语音数据进行音频事件检测,可以检测出语音数据中的笑声事件,不仅可以提取语音数据中的精彩片段,使得用户能够更便捷的找到自己感兴趣的语音片段,而且该笑声事件在一定程度上可以反映聊天的气氛、说话人的情感状态、情绪变化、以及性格等重要信息,有助于为用户定制差异化的体验方案。然而,用户的语音数据中可能包含一些无意义的笑声事件,例如有些用户在说话时习惯性地加一声“呵呵”,对于检测出的此类无意义的笑声事件,不但对后续语音数据处理过程没有帮助,反而会影响语音数据处理的效率以及用户的体验。
技术实现思路
本专利技术实施例提供一种数据处理方法、装置和用于数据处理的装置,可以提高用户在语音数据定位音频事件的效率。为了解决上述问题,本专利技术 ...
【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n对语音数据进行音频事件检测,识别所述语音数据中的音频事件;/n确定所述音频事件对应的事件类型;/n根据所述音频事件在所述语音数据中的相关位置、以及所述音频事件对应的事件类型,对所述语音数据进行标记。/n
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
对语音数据进行音频事件检测,识别所述语音数据中的音频事件;
确定所述音频事件对应的事件类型;
根据所述音频事件在所述语音数据中的相关位置、以及所述音频事件对应的事件类型,对所述语音数据进行标记。
2.根据权利要求1所述的方法,其特征在于,所述确定所述音频事件对应的事件类型,包括:
确定所述音频事件在所述语音数据中对应的语音帧序列;
根据所述语音帧序列的基频特征和音强分布特征,确定所述音频事件的事件类型,所述事件类型包括:单人事件或多人事件。
3.根据权利要求2所述的方法,其特征在于,所述根据所述语音帧序列的基频特征和音强分布特征,确定所述音频事件的事件类型,包括:
计算所述语音帧序列中包含基频的语音帧的比例;
判断所述比例是否大于第一阈值,若大于,则确定所述音频事件的事件类型为单人事件;否则,计算所述语音帧序列中各语音帧的音强差平均绝对值;
判断所述音强差平均绝对值是否大于第二阈值,若大于,则确定所述音频事件的事件类型为单人事件;否则,确定所述音频事件的事件类型为多人事件。
4.根据权利要求2所述的方法,其特征在于,所述根据所述语音帧序列的基频特征和音强分布特征,确定所述音频事件的事件类型之后,所述方法还包括:
将所述语音帧序列输入训练得到的识别模型中,得到所述语音帧序列对应的事件内容;
根据所述事件内容,确定对所述语音数据进行标记时使用的标记信息。
5.根据权利要求1所述的方法,其特征在于,所述根据所述音频事件在所述语音数据中的相关位置、以及所述音频事件对应的事件类型,对所述语音数据进行标记,包括:
根据所述音频事件对应的事件类型,生成所述音频事件对应的标记信息,所述标记信息至少包括如下任意一种:文字、图片、以及符号;
在所述语音数据中所述...
【专利技术属性】
技术研发人员:朱紫薇,潘逸倩,刘忠亮,唐文琦,杨岩,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。