一种演讲训练反馈方法、装置及存储介质制造方法及图纸

技术编号：38320822 阅读：13 留言：0更新日期：2023-07-29 09:02

本发明专利技术公开了一种演讲训练反馈方法、装置及存储介质，通过采集设备实时获取演讲者的图像数据以及声音数据,图像数据包括演讲者的所在空间的三维深度信息,基于多模态数据进行后续处理分析，有利于提供更加准确的数据支持；通过边缘设备实时地基于自适应增强模型以及区域注意力机制对图像数据进行第一处理、基于自适应抑制模型以及语音活动检测模型对声音数据进行第二处理、对第一处理结果以及第二处理结果多模态融合识别，实现更快速的处理速度，保证实时性；匹配目标演讲效果评估模型输出改进建议，保证了模态分析结果以及改进建议的实时性，有利于演讲者及时改进调整，提高演讲效果，考虑演讲者的需求，有利于提高用户体验。验。验。

全部详细技术资料下载

【技术实现步骤摘要】
一种演讲训练反馈方法、装置及存储介质

[0001]本专利技术涉及深度学习
，特别是涉及一种演讲训练反馈方法、装置及存储介质。

技术介绍

[0002]传统对人物对象的分析方法往往只考虑单一的数据源，例如对表情进行单一的分析，数据来源单一导致最终的分析结果准确性较差。同时，传统的图像数据处理往往是在云端进行的，大量图像数据上传至云端，对网络的要求高，并且存在计算延迟高、处理速度慢的问题。最后，传统分析的方法仅仅考虑人物本身的表现而忽略了不同人物对象的不同需求，用户体验差。

技术实现思路

[0003]基于此，本专利技术的目的在于解决上述问题中的至少之一，提供一种演讲训练反馈方法、装置及存储介质。
[0004]本专利技术实施例提供了一种演讲训练反馈方法，包括：通过采集设备实时获取演讲者的图像数据以及声音数据；所述图像数据包括所述演讲者的所在空间的三维深度信息；通过边缘设备实时地基于自适应增强模型以及区域注意力机制对所述图像数据进行第一处理、基于自适应抑制模型以及语音活动检测模型对所述声音数据进行第二处理、对第一处理结果以及第二处理结果多模态融合识别，得到外表特征信息以及声音特征信息融合后融合特征向量；通过所述边缘设备实时地对所述融合特征向量进行模态分析，得到模态分析结果，并响应于输入的第一需求信息，匹配目标演讲效果评估模型输出改进建议，实时显示所述模态分析结果以及所述改进建议。
[0005]进一步，所述通过采集设备实时获取演讲者的图像数据以及声音数据，包括：通过AI辅助调节系统实时检测所...

【技术保护点】

【技术特征摘要】
1.一种演讲训练反馈方法，其特征在于，包括：通过采集设备实时获取演讲者的图像数据以及声音数据；所述图像数据包括所述演讲者的所在空间的三维深度信息；通过边缘设备实时地基于自适应增强模型以及区域注意力机制对所述图像数据进行第一处理、基于自适应抑制模型以及语音活动检测模型对所述声音数据进行第二处理、对第一处理结果以及第二处理结果多模态融合识别，得到外表特征信息以及声音特征信息融合后融合特征向量；通过所述边缘设备实时地对所述融合特征向量进行模态分析，得到模态分析结果，并响应于输入的第一需求信息，匹配目标演讲效果评估模型输出改进建议，实时显示所述模态分析结果以及所述改进建议。2.根据权利要求1所述演讲训练反馈方法，其特征在于：所述通过采集设备实时获取演讲者的图像数据以及声音数据，包括：通过AI辅助调节系统实时检测所述演讲者的姿态和位置，自动调节高清摄像头以及深度摄像头的位置角度，以通过所述高清摄像头实时获取所述演讲者的高清图像以及通过所述深度摄像头实时获取所述三维深度信息，得到所述图像数据；通过灵敏麦克风实时采集所述演讲者的声音信号以及通过阵列麦克风实时采集所述演讲者的所在空间的噪声信号并进行降噪处理，得到所述声音数据。3.根据权利要求1
‑
2任一项所述演讲训练反馈方法，其特征在于：所述基于自适应增强模型以及区域注意力机制对所述图像数据进行第一处理，包括：基于自适应增强模型对所述图像数据的图像信息进行自适应调整得到质量提高后的新图像数据；基于所述区域注意力机制学习所述新图像数据不同区域的重要性以及关注度，以对所述新图像数据的不同区域进行不同程度的图像处理，得到第一处理结果。4.根据权利要求3所述演讲训练反馈方法，其特征在于：所述方法还包括：通过所述边缘设备实时地通过外表情感识别模型，对所述图像数据或者所述第一处理结果进行外表情感分析，得到所述演讲者的外表情感信息，获取场景信息或者第二需求信息，根据所述外表情感信息以及根据所述场景信息和第二需求信息中的其中一个，实时显示对所述演讲者的外表情感调整建议；通过所述边缘设备实时地通过语音情感识别模型进行声音情感分析，得到所述演讲者的声音情感信息，获取场景信息或者第三需求信息，根据所述声音情感信息以及根据所述场景信息和第三需求信息中的其中一个，实时显示对所述演讲者的声音情感调整建议。5.根据权利要求3所述演讲训练反馈方法，其特征在于：所述基于自适应抑制模型以及语音活动检测模型对所述声音数据进行第二处理，包括：基于所述自适应抑制模型根据所述演讲者的所在空间的噪声特征对所述声音数据进行自适应抑制，得到质量提高后的新声音数据；基于所述语音活动检测模型...

【专利技术属性】
技术研发人员：李翔，赵璧，刘慧，张龙，方泽军，
申请(专利权)人：新励成教育科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人