样本数据生成方法、装置、终端设备及可读存储介质制造方法及图纸

技术编号：33452802 阅读：30 留言：0更新日期：2022-05-19 00:36

本申请提供一种样本数据生成方法、装置、终端设备及可读存储介质，涉及音视频处理技术领域，其中，该方法包括：采集朗读者在朗读预设文本时的音频数据和视频数据，视频数据包括朗读者的人脸；对音频数据进行去噪处理，得到去噪后的音频数据；将视频数据和去噪后的音频数据作为样本数据。本申请提供的技术方案，通过采集朗读者在朗读预设文本时的音频数据和视频数据，并对音频数据进行去噪处理，得到去噪后的音频数据，最后将视频数据和去噪后的音频数据作为样本数据，从而可以简单方便地获取样本数据，避免了获取样本数据成本较高的问题，可以提高获取样本数据的便利性和灵活性，而且可以提高训练训练机器人多模态情绪分析的效率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
样本数据生成方法、装置、终端设备及可读存储介质

[0001]本申请涉及音视频处理技术，尤其涉及一种样本数据生成方法、装置、终端设备及可读存储介质，属于音视频处理

技术介绍

[0002]随着机器人技术的不断发展，机器人可以采用多模态技术，通过视频数据中用户的表情和说话的文本，识别并输出视频数据中用户的情绪状态(如高兴、悲伤和愤怒等)。
[0003]现有技术中，机器人可以接收大量视频类型的样本数据，并对各个样本数据进行识别，确定每个样本数据中的用户的情绪状态，从而完成对机器人的训练。
[0004]但是，用于训练的样本数据的要求较高，需要满足多种条件。而现有技术中的开源样本数据的质量参差不齐，无法满足训练机器人的要求。因此，亟需一种生成用于多模态情绪分析的样本数据的方法，以提高训练机器人多模态情绪分析的效率。

技术实现思路

[0005]有鉴于此，本申请实施例提供一种样本数据生成方法、装置、终端设备及可读存储介质，以解决亟需一种生成用于多模态情绪分析的样本数据的方法的问题。
[000...

【技术保护点】

【技术特征摘要】
1.一种样本数据生成方法，其特征在于，所述方法包括：采集朗读者在朗读预设文本时的音频数据和视频数据，所述视频数据包括所述朗读者的人脸；对所述音频数据进行去噪处理，得到去噪后的音频数据；将所述视频数据和所述去噪后的音频数据作为样本数据。2.根据权利要求1所述的方法，其特征在于，所述对所述音频数据进行去噪处理，得到去噪后的音频数据，包括：获取所述音频数据的存储路径；根据所述存储路径，结合触发的去噪操作，对所述音频数据进行去噪处理，得到所述去噪后的音频数据。3.根据权利要求1所述的方法，其特征在于，所述采集朗读者在朗读预设文本时的音频数据和视频数据，包括：展示采集界面，所述采集界面用于提醒所述朗读者录入所述音频数据和所述视频数据，所述采集界面中包括所述预设文本和录制选项；响应于对所述录制选项触发的操作，采集所述音频数据和所述视频数据。4.根据权利要求3所述的方法，其特征在于，在所述采集朗读者在朗读预设文本时的音频数据和视频数据之后，所述方法还包括：根据所述预设文本对所述音频数据和所述视频数据进行识别，得到识别结果；在所述采集界面中展示所述识别结果；若所述识别结果为未通过，则提醒所述朗读者再次录入音频数据和视频数据。5.根据权利要求1所述的方法，其特征在于，在所述将所述视频数据和所述去噪后的音频数据作为样...

【专利技术属性】
技术研发人员：郑泽鸿，黄东延，丁万，杨志勇，颜霖煌，
申请(专利权)人：深圳市优必选科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人