【技术实现步骤摘要】
一种讲授场景中的说话人语音识别系统
本专利技术属于人工智能
,具体涉及一种讲授场景中的说话人语音识别系统。
技术介绍
现有的评价体系无非以卷面成绩,考试测评,抽样调查,学生家长访谈来评价教学质量,这是很受限的不能真实的刻画上课质量。针对该技术问题,本专利技术通过人工智能算法对说话人进行语音识别,准确分割出说话人的语音音频活动区间进行识别,通过分割出的音频区间进一步可以分析出说话人当时的说话情绪,来达到真实客观评价课堂教学质量。
技术实现思路
本专利技术的目的在于克服以上存在的技术问题,提供一种讲授场景中的说话人语音识别系统。为实现上述目的,本专利技术采用如下的技术方案:一种讲授场景中的说话人语音识别系统,包括摄像头、麦克风、视频音频输入模块、信号增强模块、云端服务器模块和输出模块;所述云端服务器模块包括GPU服务器机群、人工智能算法模块和大数据处理模块;所述摄像头捕捉到的视频流和麦克风捕捉到的声音信号通过视频音频输入模块输送到信号增强模块,信号增强模块再输入到GPU服务器机群,GPU服务器机群通过大数据处理模块对数据先进行清洗,再由人工智能算法模块对数据进行处理 ...
【技术保护点】
1.一种讲授场景中的说话人语音识别系统,其特征在于:包括摄像头、麦克风、视频音频输入模块、信号增强模块、云端服务器模块和输出模块;所述云端服务器模块包括GPU服务器机群、人工智能算法模块和大数据处理模块;所述摄像头捕捉到的视频流和麦克风捕捉到的声音信号通过视频音频输入模块输送到信号增强模块,信号增强模块再输入到GPU服务器机群,GPU服务器机群通过大数据处理模块对数据先进行清洗,再由人工智能算法模块对数据进行处理,并将处理的结果传输给输出模块。
【技术特征摘要】
1.一种讲授场景中的说话人语音识别系统,其特征在于:包括摄像头、麦克风、视频音频输入模块、信号增强模块、云端服务器模块和输出模块;所述云端服务器模块包括GPU服务器机群、人工智能算法模块和大数据处理模块;所述摄像头捕捉到的视频流和麦克风捕捉到的声音信号通过视频音频输入模块输送到信号增强模块,信号增强模块再输入到GPU服务器机群,GPU服务器机群通过大数据处理模块对数据先进行清洗,再由人工智能算法模块对数据进行处理,并将处理的结果传输给输出模块。2.根据权利要求1所述的讲...
【专利技术属性】
技术研发人员:张文铸,杜远超,
申请(专利权)人:北京清帆科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。