一种讲授场景中的说话人语音识别系统技术方案

技术编号：21005450 阅读：30 留言：0更新日期：2019-04-30 21:52

本发明专利技术公开了一种讲授场景中的说话人语音识别系统，包括摄像头、麦克风、视频音频输入模块、信号增强模块、云端服务器模块和输出模块；本发明专利技术运用机器学习深度学习的方法对说话人的语音音频数据进行处理，划分不同说话人的音频区间，进一步可分析说话人此时的情绪，通过实时监控，实时数据处理，可作为教学评估的一个指标，该指标是衡量教学质量的一个重要环节，打破了传统的抽样调查，访谈，考试测评等条件的限制，可以客观真实的反应课上情况。

A Speaker Speech Recognition System in Teaching Scene

全部详细技术资料下载

【技术实现步骤摘要】
一种讲授场景中的说话人语音识别系统
本专利技术属于人工智能
，具体涉及一种讲授场景中的说话人语音识别系统。
技术介绍
现有的评价体系无非以卷面成绩，考试测评，抽样调查，学生家长访谈来评价教学质量，这是很受限的不能真实的刻画上课质量。针对该技术问题，本专利技术通过人工智能算法对说话人进行语音识别，准确分割出说话人的语音音频活动区间进行识别，通过分割出的音频区间进一步可以分析出说话人当时的说话情绪，来达到真实客观评价课堂教学质量。
技术实现思路
本专利技术的目的在于克服以上存在的技术问题，提供一种讲授场景中的说话人语音识别系统。为实现上述目的，本专利技术采用如下的技术方案：一种讲授场景中的说话人语音识别系统，包括摄像头、麦克风、视频音频输入模块、信号增强模块、云端服务器模块和输出模块；所述云端服务器模块包括GPU服务器机群、人工智能算法模块和大数据处理模块；所述摄像头捕捉到的视频流和麦克风捕捉到的声音信号通过视频音频输入模块输送到信号增强模块，信号增强模块再输入到GPU服务器机群，GPU服务器机群通过大数据处理模块对数据先进行清洗，再由人工智能算法模块对数据进行处理...

【技术保护点】
1.一种讲授场景中的说话人语音识别系统，其特征在于：包括摄像头、麦克风、视频音频输入模块、信号增强模块、云端服务器模块和输出模块；所述云端服务器模块包括GPU服务器机群、人工智能算法模块和大数据处理模块；所述摄像头捕捉到的视频流和麦克风捕捉到的声音信号通过视频音频输入模块输送到信号增强模块，信号增强模块再输入到GPU服务器机群，GPU服务器机群通过大数据处理模块对数据先进行清洗，再由人工智能算法模块对数据进行处理，并将处理的结果传输给输出模块。

【技术特征摘要】
1.一种讲授场景中的说话人语音识别系统，其特征在于：包括摄像头、麦克风、视频音频输入模块、信号增强模块、云端服务器模块和输出模块；所述云端服务器模块包括GPU服务器机群、人工智能算法模块和大数据处理模块；所述摄像头捕捉到的视频流和麦克风捕捉到的声音信号通过视频音频输入模块输送到信号增强模块，信号增强模块再输入到GPU服务器机群，GPU服务器机群通过大数据处理模块对数据先进行清洗，再由人工智能算法模块对数据进行处理，并将处理的结果传输给输出模块。2.根据权利要求1所述的讲...

【专利技术属性】
技术研发人员：张文铸，杜远超，
申请(专利权)人：北京清帆科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人