数据处理方法、装置、设备及介质制造方法及图纸

技术编号：34849968 阅读：29 留言：0更新日期：2022-09-08 07:49

本公开提供了一种数据处理方法、装置、设备及介质，涉及人工智能技术领域，尤其涉及智能语音技术领域。实现方案为：在第一时刻使能采集设备在预设场景中执行音频数据采集；在第二时刻使能播放设备在预设场景中播放干声数据，以使采集设备能够采集到含有干声数据的场景音频数据，其中，干声数据包括在时域上不重叠的多个交互信息，每个交互信息具有该交互信息在干声数据的持续时段中的第一定位信息，场景音频数据中含有多个交互信息中的一个或多个；以及针对场景音频数据中的每一个交互信息，基于第一时刻、第二时刻以及该交互信息的第一定位信息，确定该交互信息在场景音频数据的持续时段中的第二定位信息。的持续时段中的第二定位信息。的持续时段中的第二定位信息。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、装置、设备及介质

[0001]本公开涉及人工智能
，尤其涉及智能语音
，具体涉及一种数据处理的方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0004]本公开提供了一种数据处理的方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，包括：在第一时刻使能采集设备在预设场景中执行音频数据采集；在第二时刻使能播放设备在所述预设场景中播放干声数据，以使所述采集设备能够采集到含有所述干声数据的场景音频数据，其中，所述干声数据包括在时域上不重叠的多个交互信息，每个交互信息具有该交互信息在所述干声数据的持续时段中的第一定位信息，所述场景音频数据中含有所述多个交互信息中的一个或多个；以及针对所述场景音频数据中的每一个交互信息，基于所述第一时刻、所述第二时刻以及该交互信息的第一定位信息，确定该交互信息在所述场景音频数据的持续时段中的第二定位信息。2.根据权利要求1所述的方法，其中，所述基于所述第一时刻、所述第二时刻以及该交互信息的第一定位信息，确定该交互信息在所述场景音频数据的持续时段中的第二定位信息包括：确定所述第一时刻与所述第二时刻之间的时间差；以及基于所述时间差和该交互信息的所述第一定位信息，确定该交互信息的所述第二定位信息。3.根据权利要求1或2所述的方法，其中，每个交互信息的所述第一定位信息包括以下至少一种：该交互信息在所述干声数据的持续时段中的起始时刻；和该交互信息在所述干声数据的持续时段中的结束时刻。4.根据权利要求3所述的方法，其中，每个交互信息的所述第一定位信息通过对所述干声数据的端点检测而确定。5.根据权利要求1至4中任意一项所述的方法，其中，所述预设场景包括安静场景和噪声场景中的任意一种。6.根据权利要求5所述的方法，其中，所述噪声场景中的噪声包括以下至少一种：环境噪声；和所述采集设备的内部噪声。7.根据权利要求1至6中任意一项所述的方法，其中，所述采集设备中具有语音交互系统，所述方法还包括：利用所述场景音频数据，执行针对所述语音交互系统的训练或测试。8.一种数据处理装置，包括：第一使能单元，被配置用于在第一时刻使能采集设备在预设场景中执行音频数据采集；第二使能单元，被配置用于在第二时刻使能播放设备在所述预设场景中播放干声数据，以使所述采集设备能够采集到含有所述干声数据的场景音频数据，其中，所述干声数据包括在时域上不重叠的多个交互信息，每个交互信息具有该交互信息...

【专利技术属性】
技术研发人员：刘巍，王新宇，刘露平，车婷婷，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人