一种网络教学实时语音分析系统技术方案

技术编号:14524859 阅读:89 留言:0更新日期:2017-02-02 03:23
本发明专利技术提供了一种网络教学实时语音分析系统,包括:捕获组件,其用于捕获语音输入;自动语音识别ASR组件,其用于执行所述语音输入的实时识别;分析组件,其用于根据分析语音输入内容获取相应数据,并对相应数据进行处理,包括数据采集模块、数据分类模块、分类检测模块和检测融合模块。本发明专利技术的有益效果为:实现了实时语音教学。

【技术实现步骤摘要】

本专利技术涉及语音分析领域,具体涉及一种网络教学实时语音分析系统。
技术介绍
常规的语音识别组件经过预先训练,因此高度地非个人化。实际上,常规计算机辅助工具不能动态适应用户语音或者用户与他人对话中的内容。常规方法还需要主动练习。预先选择的文本可能不对应于用户最常说的单词和词组。使用常规技术,可能难以涵盖用户习惯性说的某些事物。
技术实现思路
针对上述问题,本专利技术旨在提供一种网络教学实时语音分析系统。本专利技术的目的采用以下技术方案来实现:提供了一种网络教学实时语音分析系统,包括:捕获组件,其用于捕获语音输入;自动语音识别ASR组件,其用于执行所述语音输入的实时识别;分析组件,其用于根据分析语音输入内容获取相应数据,并对相应数据进行处理,包括数据采集模块、数据分类模块、分类检测模块和检测融合模块。本专利技术的有益效果为:实现了实时语音教学。附图说明利用附图对本专利技术作进一步说明,但附图中的实施例不构成对本专利技术的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。图1是本专利技术的结构连接示意图;图2是本专利技术分析组件示意图。附图标记:捕获组件1、自动语音识别ASR组件2、分析组件3、数据采集模块31、数据分类模块32、分类检测模块33、检测融合模块34。具体实施方式结合以下实施例对本专利技术作进一步描述。参见图1、图2,本实施例的一种网络教学实时语音分析系统,包括:捕获组件1,其用于捕获语音输入;自动语音识别ASR组件2,其用于执行所述语音输入的实时识别;分析组件3,其用于根据分析语音输入内容获取相应数据,并对相应数据进行处理,包括数据采集模块31、数据分类模块32、分类检测模块33和检测融合模块34,所述数据采集模块31用于采集需要进行检测的数据;所述数据分类模块32用于将由数据采集模块31输出的数据划分为图像数据和文本数据,并对分类后的数据进行过滤处理;所述分类检测模块33用于对分类后的数据进行分析检测;所述检测融合模块34用于根据检测需求筛选所需的图像数据和文本数据。优选地,还包括错误汇总组件,其对无法进行识别和识别错误的语音进行汇总。本优选实施例能够对语音分析系统进行改进。优选地,还包括交互式用户接口组件,其中所述接口组件使用用户反馈信息来分析错误并建议错误纠正。本优选实施例语音分析系统更加个性化。优选的,所述采集需要进行检测的数据,包括:(1)采集一定时间段内需要进行检测的数据,按设定的过滤规则对该数据进行初步过滤处理,所述设定的过滤规则包括删除包含特殊字符、推广相关的特殊汉字和网页链接的内容的数据;(2)设所述一定时间段的时间范围为[VB,VE],将[VB,VE]按照时间顺序平均分为n个子时间段,对每个子时间段内的数据进行重要度评估,评估公式定义为:Si=STi+ZiZ×100%,1≤i≤n]]>式中,Si为第i个子时间段的重要程度,STi为设定的第i个子时间段的重要程度值,Zi为第i个子时间段的数据的数量,Z为在[VB,VE]内的数据的数量。(3)将各重要度按照由小到大进行排序,按照重要度的排列顺序,将数据依次发送至数据分类模块32。本优选实施例通过设定过滤规则,将不需要进行检测的数据进行删除,减少了检测后续处理的数据量;通过对各子时间段的数据进行重要度评估,并按照重要度的排列顺序,将数据依次发送至数据分类模块32,使后续的模块能够预先处理重要程度高的数据,提高了检测的速度。优选的,所述对分类后的数据进行过滤处理,包括:提取文本数据,对该文本数据进行聚类处理,形成多个类别的文本数据集;计算每个类别的文本数据集中的数据的数量,按照数量由少到大的顺序对多个文本数据集进行排序;删除前23%的文本数据集,将剩余的文本数据集以及图像数据发送至分类检测模块33。本优选实施例进一步对文本数据进行聚类处理,过滤掉数量较少的文本数据集,减少了后续检测的数据量,从而进一步提高了检测的速度。优选的,所述对该文本数据进行聚类处理,包括:(1)确定聚簇的个数K,包括:对该文本数据采用等距法设定k-means聚类算法的初始中心,得到聚类中心;在得到聚类中心后将相邻的聚类中心的中点作为分类的划分点,将各个对象加入到距离最近的类中,从而确定聚簇的个数K;(2)将该文本数据划分为n个样本,对n个样本进行向量化,通过夹角余弦函数计算所有样本两两之间的相似度,得到相似度矩阵SIM:SIM=[sim(ci,cj)]n×n,i,j=1,…,n(3)计算每一个样本与其它所有样本的相似度之和,求和公式为:SIMci=Σj=1nsim(ci,cj)]]>式中,为样本ci与其它所有样本的相似度之和,sim(ci,cj)表示样本ci,cj间的相似度,i,j=1,…,n;(4)按降序排列设按从大到小排列的前4个值对应的样本为cmax,cmax-1,cmax-2,cmax-3,根据下列公式确定第一个初始的聚簇中心MEDIUM:MEDIUM=14Σμ=03ωmax-μcmax-μ]]>式中,ωmax-μ表示cmax-μ的重要度权值;(5)对中的最大值对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为SIMpq,q=1,…k-1,选择前k-1个最小的元素SIMpq相对应的样本作为剩余的k-1个初始的聚簇中心;(6)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:L=Σl=1kΣcx∈Cl||cx-cxl‾||2]]>式中,Cl表示k个聚簇中的第l个聚簇,cx为第l个聚簇中的样本,为第l个聚簇的中心。本优选实施例有效避免单一采取随机抽样方法所带来的偶然性,解决对该文本数据进行聚类处理时在选取k值以及初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了对文本数据进行过滤处理的精度。优选的,所述分类检测模块33包括图像数据检测单元和文本数据检测单元;所述图像数据检测单元基于语义特征对图像数据进行检测,具体为:采用小波变换的方法对图像进行分割,对区域低层特征进行提取,构造特征矩阵,再应用非负矩阵分解训练算法构造语义空间,将图像投影到该空间以获取图像语义特征;所述文本数据检测单元包括文本数据建模子单元、文本数据分类子单元、检测子单元,具体为:(1)文本数据建模子单元,用于使用构成文档的词项来表达文档的语义,其将n篇文档t1,t2,…,tn的每篇文档表示成m维特征向量v1,v2,…,vm,构成n×m的文档-特征矩阵:式中,m为构成文档的词项的数量;w(ti,vj)=f(ti,vj)×n/f(vj)Σj=1m[f(ti,vj)×n/f(vj)]2,1≤i≤n,1≤j≤m]]>式中,w(ti,vj)表示词项vj在文档ti中所占权重,f(ti,vj)表示词项vj在文档ti中出本文档来自技高网...

【技术保护点】
一种网络教学实时语音分析系统,其特征是,包括:捕获组件,其用于捕获语音输入;自动语音识别ASR组件,其用于执行所述语音输入的实时识别;分析组件,其用于根据分析语音输入内容获取相应数据,并对相应数据进行处理,包括数据采集模块、数据分类模块、分类检测模块和检测融合模块。

【技术特征摘要】
1.一种网络教学实时语音分析系统,其特征是,包括:捕获组件,其用于捕获语音输入;自动语音识别ASR组件,其用于执行所述语音输入的实时识别;分析组件,其用于根据分析语音输入内容获取相应数据,并对相应数据进行处理,包括数据采集模块、数据分类模块、分类检测模块和检测融合模块。2.根据权利要求1所述的一种网络教学实时语音分析系统,其特征是,还包括错误汇总组件,其对无法进行识别和识别错误的语音进行汇总。3.根据权利要求2所述的一种网络教学实时语音分析系统,其特征是,还包括交互式用户接口组件,其中所述接口组件使用用户反馈信息来分析错误并建议错误纠正。4.根据权利要求3所述的一种网络教学实时语音分析系统,其特征是,所述采集需要进行检测的数据,...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:深圳大图科创技术开发有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1