一种数据处理方法、装置和用于数据处理的装置制造方法及图纸

技术编号：23764607 阅读：33 留言：0更新日期：2020-04-11 19:10

本发明专利技术实施例提供了一种数据处理方法、装置和用于数据处理的装置。其中的方法具体包括：对语音数据进行音频事件检测，识别所述语音数据中的音频事件；确定所述音频事件对应的事件类型；根据所述音频事件在所述语音数据中的相关位置、以及所述音频事件对应的事件类型，对所述语音数据进行标记。本发明专利技术实施例便于用户在语音数据中可以快速定位到所需事件类型对应音频事件的位置，可以提高用户体验和语音数据的处理效率。

A data processing method, device and device for data processing

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法、装置和用于数据处理的装置
本专利技术涉及计算机
，尤其涉及一种数据处理方法、装置和用于数据处理的装置。
技术介绍
在用户的日常自然言语中，会出现哈欠、掌声、笑声等非文字类的音频事件，对语音数据进行音频事件检测，在语音处理领域具有重要意义。通过对语音数据进行音频事件检测，可以检测出语音数据中的笑声事件，不仅可以提取语音数据中的精彩片段，使得用户能够更便捷的找到自己感兴趣的语音片段，而且该笑声事件在一定程度上可以反映聊天的气氛、说话人的情感状态、情绪变化、以及性格等重要信息，有助于为用户定制差异化的体验方案。然而，用户的语音数据中可能包含一些无意义的笑声事件，例如有些用户在说话时习惯性地加一声“呵呵”，对于检测出的此类无意义的笑声事件，不但对后续语音数据处理过程没有帮助，反而会影响语音数据处理的效率以及用户的体验。
技术实现思路
本专利技术实施例提供一种数据处理方法、装置和用于数据处理的装置，可以提高用户在语音数据定位音频事件的效率。为了解决上述问题，本专利技术...

【技术保护点】
1.一种数据处理方法，其特征在于，所述方法包括：/n对语音数据进行音频事件检测，识别所述语音数据中的音频事件；/n确定所述音频事件对应的事件类型；/n根据所述音频事件在所述语音数据中的相关位置、以及所述音频事件对应的事件类型，对所述语音数据进行标记。/n

【技术特征摘要】
1.一种数据处理方法，其特征在于，所述方法包括：
对语音数据进行音频事件检测，识别所述语音数据中的音频事件；
确定所述音频事件对应的事件类型；
根据所述音频事件在所述语音数据中的相关位置、以及所述音频事件对应的事件类型，对所述语音数据进行标记。

2.根据权利要求1所述的方法，其特征在于，所述确定所述音频事件对应的事件类型，包括：
确定所述音频事件在所述语音数据中对应的语音帧序列；
根据所述语音帧序列的基频特征和音强分布特征，确定所述音频事件的事件类型，所述事件类型包括：单人事件或多人事件。

3.根据权利要求2所述的方法，其特征在于，所述根据所述语音帧序列的基频特征和音强分布特征，确定所述音频事件的事件类型，包括：
计算所述语音帧序列中包含基频的语音帧的比例；
判断所述比例是否大于第一阈值，若大于，则确定所述音频事件的事件类型为单人事件；否则，计算所述语音帧序列中各语音帧的音强差平均绝对值；
判断所述音强差平均绝对值是否大于第二阈值，若大于，则确定所述音频事件的事件类型为单人事件；否则，确定所述音频事件的事件类型为多人事件。

4.根据权利要求2所述的方法，其特征在于，所述根据所述语音帧序列的基频特征和音强分布特征，确定所述音频事件的事件类型之后，所述方法还包括：
将所述语音帧序列输入训练得到的识别模型中，得到所述语音帧序列对应的事件内容；
根据所述事件内容，确定对所述语音数据进行标记时使用的标记信息。

5.根据权利要求1所述的方法，其特征在于，所述根据所述音频事件在所述语音数据中的相关位置、以及所述音频事件对应的事件类型，对所述语音数据进行标记，包括：
根据所述音频事件对应的事件类型，生成所述音频事件对应的标记信息，所述标记信息至少包括如下任意一种：文字、图片、以及符号；
在所述语音数据中所述...

【专利技术属性】
技术研发人员：朱紫薇，潘逸倩，刘忠亮，唐文琦，杨岩，
申请(专利权)人：北京搜狗科技发展有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人