【技术实现步骤摘要】
一种基于智能化语音数据识别的分析纠正系统
[0001]本专利技术属于语音识别领域,涉及数据分析技术,具体是一种基于智能化语音数据识别的分析纠正系统
。
技术介绍
[0002]语音识别是一门交叉学科,近二十年来,语音识别技术取得显著进步,开始从实验室走向市场,语音识别技术所涉及的领域包括:信号处理
、
模式识别
、
概率论和信息论
、
发声机理和听觉机理
、
人工智能等
。
[0003]现有语音数据识别的分析纠正系统仅能够通过字符比对的方式对识别文本的精确性进行监控,但是这种方式无法对识别文本中字符组成的语言意义进行分析,导致识别文本出现语义识别错误时的纠正分析效率低下
。
[0004]针对上述技术问题,本申请提出一种解决方案
。
技术实现思路
[0005]本专利技术的目的在于提供一种基于智能化语音数据识别的分析纠正系统,用于解决现有语音数据识别的分析纠正系统无法对识别文本中字符组成的语言意义进行分析 ...
【技术保护点】
【技术特征摘要】
1.
一种基于智能化语音数据识别的分析纠正系统,其特征在于,包括分析纠正平台,所述分析纠正平台通信连接有识别分析模块
、
语义分析模块
、
字符纠正模块以及存储模块;所述分析纠正平台接收到语音数据后将语音数据发送至识别分析模块,所述识别分析模块用于对语音数据进行识别分析:采用
n
个语音识别软件同时对语音数据进行识别转文字得到
n
个识别数据组,对识别数据组进行比对分析并得到统一系数,通过统一系数对语音数据的识别精确性是否满足要求进行判定;所述语义分析模块用于对识别数据组的语义准确性进行监测分析:将识别数据组分割为若干个语义字符段,每个语义字符段的字符数量均为
M1
个,由
n
个识别数据组中的第一个语义字符段构成语义数据组;将语义数据组标记为异常数据组或正常数据组;然后由
n
个识别数据组中的第二个语义字符段构成新的语义数据组,并重新对新的语义数据组标记为异常数据组或正常数据组;直至所有语义数据组完成标记;将异常数据组与语义数据组的数量比值标记为异常系数,通过异常系数对识别数据组的语义识别状态是否满足要求进行判定;所述字符纠正模块用于对识别数据组进行字符纠正分析
。2.
根据权利要求1所述的一种基于智能化语音数据识别的分析纠正系统,其特征在于,统一系数的获取过程包括:选取所有识别数据组中的第一个字符组成第一比对数据组,将第一比对数据组中出现次数最多的元素字符标记为识别字符,将识别字符的数量与
n
的比值标记为识别系数,通过存储模块获取到识别阈值
。3.
根据权利要求2所述的一种基于智能化语音数据识别的分析纠正系统,其特征在于,将识别系数与识别阈值进行比较:若识别系数小于识别阈值,则将对应的识别字符标记为分歧字符;若识别系数大于等于识别阈值,则将对应的识别字符标记为统一字符;选取所有识别数据组中的第二个字符组成第二比对数据组,将第二比对数据组中的识别字符标记为分歧字符或统一字符;以此类推,直至最后一个比对数据组的识别字符完成标记;将统一字符的数量与比对数据组的数量的比值标记为语音数据的统一系数
。4.
根据权利要求3所述的一种基于智能化语音数据识别的分析纠正系统,其特征在于,对语音数据的识别精确性是否满足要求进行判定的具体过程包括:通过存储模块获取到统一阈值,将语音数据的统一系数与统一阈值进行比较:若统一系数小于统一阈值,则判定语音数据的识别精确性不满足要求,将
n
个识别数据组通过分析纠正平台发送至语义分析模块;若统一系数大于等于统一阈值,则判定语音数据的识别精确性满足要求,将
n
个识别数据组通过分析纠正平台发送至字符纠正模块
。5.
根据权利要求4所述的一种基于智能化语音数据识别的分析纠正系统,其特征在于,将语义数据组标记为异常数据组或正常数据组的具体过程包括:随机选取语义数据组中的一个字符并判定该字符是否在
n
个语义字符段中均有出现:若是,则将对应字符标记为规划字符;若否,则将对应字符标记为独立字符
。6.
根据权利要求4所述的一种基于智能化语音数据识别的分析纠正系统,其特征在于,将语义数据组中的所有字符全部标记为规划字符或独立字符之后,将规划字符的字符数量与语义数据组中的字符数量比值标...
【专利技术属性】
技术研发人员:吴海忠,徐梦全,
申请(专利权)人:深圳市托普思维商业服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。