一种音频的音阶分析方法和系统技术方案

技术编号:15393050 阅读:169 留言:0更新日期:2017-05-19 05:37
本发明专利技术公开了一种音频的音阶分析方法和系统,属于用于声音检测的医疗设备领域。本发明专利技术是一种音频的音阶分析方法,包括:提取音频中单字的音频;将每个所述单字的音频由时域转换为频域;获取所述频域中特征频率;根据所述特征频率所处频率区间:第一频率区间、第二频率区间、第三频率区间、第四频率区间、第五频率区间,判断每个所述单字的音频所属音阶:上宫、上商、上角、上徵、上羽。本发明专利技术通过提取音频中单字的音频,对多个单字的音频进行特征值提取,判断单字的音频所属音阶,从而综合判断所述音频的音阶,便于闻诊分析。

Tone scale analysis method and system

The invention discloses an audio scale analysis method and a system, belonging to the field of medical equipment used for sound detection. The invention is a kind of audio scale analysis method, including: word extract audio audio in the word; each audio from the time domain into the frequency domain to obtain the frequency domain characteristics; frequency; according to the characteristic frequency of the frequency interval: first frequency interval, second frequency interval, third frequency interval, fourth the frequency interval, fifth frequency interval judgment, each of the word belongs to Audio: Kamimiya, business scale, angle, character, feather. The invention of words by extracting audio audio feature extraction of multi word audio, audio word judgment belongs to the comprehensive judgment scale, scale of the audio, easy listening and smelling analysis.

【技术实现步骤摘要】
一种音频的音阶分析方法和系统
本专利技术涉及用于声音检测的医疗设备领域,并且更具体地,涉及一种音频的音阶分析方法和系统。
技术介绍
中医包括望诊、闻诊、问诊和切诊。闻诊是从病人发生的各种声音,从其高低、缓急、强弱、清浊测知病性的方法。在现有技术中,闻诊分析是建立在音频所属音阶分析的基础上,以声音的谐波和共振峰属性的特点提取人声音中的特征值,通过人声音的特征值来判断此人属于二十五音的具体音阶。现有的方法和技术是通过对人声音的生理学原理分析、经过大量的数据统计、参照《皇帝内经》以及二十五音的定义等综合分析得出的一个比较精准的分析结果。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下缺陷:现有技术中闻诊声音特征值选取是通过人的主观判断来选择,同一段音频文件可能因为不同的人而选取不同的声音特征值,得出不同的结果;闻诊的测试声音是选取固定的词,测试具有局限性;收集闻诊测试音频时,所朗读每个字都需要停顿,和人正常说话不符,造成使用不方便。
技术实现思路
本专利技术的目的是提供一种音频的音阶分析方法和系统,通过提取音频中单字的音频,对多个单字的音频进行特征值提取,判断单字的音频所属音阶,从而综合判断所述音频的音阶,便于闻诊分析。根据本专利技术的一个方面,一种音频的音阶分析方法,包括:提取音频中单字的音频;将每个所述单字的音频由时域转换为频域;获取所述频域中特征频率;根据所述特征频率所处频率区间:第一频率区间、第二频率区间、第三频率区间、第四频率区间、第五频率区间,判断每个所述单字的音频所属音阶:上宫、上商、上角、上徵、上羽。可选的,在所述提取音频中单字的音频之前包括:采集测试的音频;对所述测试音频预处理。可选的,对所述测试音频预处理包括:对所述音频进行端点检测去除空录音和去噪。可选的,在所述获取所述频域中特征频率包括:设置频率的最小步长,获取频率为最小步长到两倍最小步长之间的第一共振峰频率f0;当第一共振峰频率f0位于最小步长到二分之三倍最小步长之间时,在频率为两倍最小步长到三倍最小步长之间获得第二共振峰频率f1;当第一共振峰频率f0不位于最小步长到二分之三倍最小步长之间时,在频率为三倍最小步长到四倍最小步长之间获得第二共振峰频率f1。可选的,在所述在频率为两倍最小步长到三倍最小步长之间获得第二共振峰频率f1之后包括:当第二共振峰频率f1位于两倍最小步长到二分之五倍最小步长之间时,在频率为四倍最小步长到五倍最小步长之间获得第三共振峰频率f2;当第二共振峰频率f1位于二分之五倍最小步长到三倍最小步长之间时,在频率为五倍最小步长到六倍最小步长之间获得第三共振峰频率f2。可选的,在在频率为三倍最小步长到四倍最小步长之间获得第二共振峰频率f1之后包括:当第二共振峰频率f1位于三倍最小步长到二分之七倍最小步长之间时,在频率为六倍最小步长到七倍最小步长之间获得第三共振峰频率f2;当第二共振峰频率f1位于二分之七倍最小步长到四倍最小步长之间时,在频率为七倍最小步长到八倍最小步长之间获得第三共振峰频率f2。可选的,所述第一频率区间:261.6~293.7,第二频率区间:293.7~329.6,第三频率区间:329.6~392.0,第四频率区间:392.0~440.0,第五频率区间:440.0~523.2;其中,当所述第三共振峰频率f2位于所述第一频率区间:261.6~293.7,所述单字的音频属于上宫;当所述第三共振峰频率f2位于所述第二频率区间:293.7~329.6,所述单字的音频属于上商;当所述第三共振峰频率f2位于所述第三频率区间:329.6~392.0,所述单字的音频属于上角;当所述第三共振峰频率f2位于所述第四频率区间:392.0~440.0,所述单字的音频属于上徵;当所述第三共振峰频率f2位于所述第五频率区间:440.0~523.2,所述单字的音频属于上羽。可选的,在判断每个所述单字的音频属于上宫、上商、上角、上徵或上羽之后包括:计算所述音频中所述上宫、上商、上角、上徵或上羽出现的权重,选取权重最大的音阶作为所述音频的音阶。根据本专利技术的另一个方面,一种音频的音阶分析系统,包括:单字的音频提取单元,提取音频中单字的音频;时频转换单元,将每个所述单字的音频由时域转换为频域;特征频率提取单元,获取所述频域中特征频率;音阶划分单元,根据所述特征频率所处频率区间:第一频率区间、第二频率区间、第三频率区间、第四频率区间、第五频率区间,判断每个所述单字的音频所属音阶:上宫、上商、上角、上徵、上羽。可选的,一种音频的音阶分析系统系统还包括:音频采集单元,采集测试的音频。可选的,一种音频的音阶分析系统系统还包括:预处理单元,对所述音频进行端点检测去空录音和去噪。可选的,所述特征频率提取单元包括:第一共振峰频率f0提取单元,设置频率的最小步长,获取频率为最小步长到两倍最小步长之间的第一共振峰频率f0;第二共振峰频率f1提取单元,当第一共振峰频率f0位于最小步长到二分之三倍最小步长之间时,在频率为两倍最小步长到三倍最小步长之间获得第二共振峰频率f1;当第一共振峰频率f0不位于最小步长到二分之三倍最小步长之间时,在频率为三倍最小步长到四倍最小步长之间获得第二共振峰频率f1;第三共振峰频率f2提取单元,当第二共振峰频率f1位于两倍最小步长到二分之五倍最小步长之间时,在频率为四倍最小步长到五倍最小步长之间获得第三共振峰频率f2;当第二共振峰频率f1位于二分之五倍最小步长到三倍最小步长之间时,在频率为五倍最小步长到六倍最小步长之间获得第三共振峰频率f2;当第二共振峰频率f1位于三倍最小步长到二分之七倍最小步长之间时,在频率为六倍最小步长到七倍最小步长之间获得第三共振峰频率f2;当第二共振峰频率f1位于二分之七倍最小步长到四倍最小步长之间时,在频率为七倍最小步长到八倍最小步长之间获得第三共振峰频率f2。可选的,所述第一频率区间:261.6~293.7,第二频率区间:293.7~329.6,第三频率区间:329.6~392.0,第四频率区间:392.0~440.0,第五频率区间:440.0~523.2;其中,当所述第三共振峰频率f2位于所述第一频率区间:261.6~293.7,所述单字的音频属于上宫;当所述第三共振峰频率f2位于所述第二频率区间:293.7~329.6,所述单字的音频属于上商;当所述第三共振峰频率f2位于所述第三频率区间:329.6~392.0,所述单字的音频属于上角;当所述第三共振峰频率f2位于所述第四频率区间:392.0~440.0,所述单字的音频属于上徵;当所述第三共振峰频率f2位于所述第五频率区间:440.0~523.2,所述单字的音频属于上羽。可选的,一种音频的音阶分析系统还包括:输出单元,计算所述音频中所述上宫、上商、上角、上徵或上羽出现的权重,选取权重最大的音阶作为所述音频的音阶输出。通过采用上述技术方案,本专利技术具有以下有益效果:本专利技术通过固定的频率提取方法,排除了人的主观性,使得分析结果更加准确;本专利技术采集的音频可以是连续的句子、短语,通过本专利技术技术方案均能分割成单字的音频,因此,降低了对测试者采集音频时要求,更便于使用;本专利技术通过对多个单字的音频综合分析判断,相当于多次测试判断,提高了分析结果的准确性。附图说明通过本文档来自技高网...
一种音频的音阶分析方法和系统

【技术保护点】
一种音频的音阶分析方法,其特征在于,包括:提取音频中单字的音频;将每个所述单字的音频由时域转换为频域;获取所述频域中特征频率;根据所述特征频率所处频率区间:第一频率区间、第二频率区间、第三频率区间、第四频率区间、第五频率区间,判断每个所述单字的音频所属音阶:上宫、上商、上角、上徵、上羽。

【技术特征摘要】
1.一种音频的音阶分析方法,其特征在于,包括:提取音频中单字的音频;将每个所述单字的音频由时域转换为频域;获取所述频域中特征频率;根据所述特征频率所处频率区间:第一频率区间、第二频率区间、第三频率区间、第四频率区间、第五频率区间,判断每个所述单字的音频所属音阶:上宫、上商、上角、上徵、上羽。2.根据权利要求1所述的方法,在所述提取音频中单字的音频之前包括:采集测试的音频;对所述测试音频预处理。3.根据权利要求2所述的方法,其中,对所述测试音频预处理包括:对所述音频进行端点检测去除空录音和去噪。4.根据权利要求1所述的方法,所述获取所述频域中特征频率包括:设置频率的最小步长,获取频率为最小步长到两倍最小步长之间的第一共振峰频率;当第一共振峰频率f0位于最小步长到二分之三倍最小步长之间时,在频率为两倍最小步长到三倍最小步长之间获得第二共振峰频率f1;当第一共振峰频率f0不位于最小步长到二分之三倍最小步长之间时,在频率为三倍最小步长到四倍最小步长之间获得第二共振峰频率f1。5.根据权利要求4所述的方法,所述在频率为两倍最小步长到三倍最小步长之间获得第二共振峰频率f1之后包括:当第二共振峰频率f1位于两倍最小步长到二分之五倍最小步长之间时,在频率为四倍最小步长到五倍最小步长之间获得第三共振峰频率f2;当第二共振峰频率f1位于二分之五倍最小步长到三倍最小步长之间时,在频率为五倍最小步长到六倍最小步长之间获得第三共振峰频率f2。6.根据权利要求4所述的方法,在频率为三倍最小步长到四倍最小步长之间获得第二共振峰频率f1之后包括:当第二共振峰频率f1位于三倍最小步长到二分之七倍最小步长之间时,在频率为六倍最小步长到七倍最小步长之间获得第三共振峰频率f2;当第二共振峰频率f1位于二分之七倍最小步长到四倍最小步长之间时,在频率为七倍最小步长到八倍最小步长之间获得第三共振峰频率f2。7.根据权利要求5或6所述的方法,其中,所述第一频率区间:261.6~293.7,第二频率区间:293.7~329.6,第三频率区间:329.6~392.0,第四频率区间:392.0~440.0,第五频率区间:440.0~523.2;其中,当所述第三共振峰频率f2位于所述第一频率区间:261.6~293.7,所述单字的音频属于上宫;当所述第三共振峰频率f2位于所述第二频率区间:293.7~329.6,所述单字的音频属于上商;当所述第三共振峰频率f2位于所述第三频率区间:329.6~392.0,所述单字的音频属于上角;当所述第三共振峰频率f2位于所述第四频率区间:392.0~440.0,所述单字的音频属于上徵;当所述第三共振峰频率f2位于所述第五频率区间:440.0~523.2,所述单字的音频属于上羽。8.根据权利要求1所述的方法,其中,在判断每个所述单字的音频属于上宫、上商、上角、上徵或上羽之后包括:计算所述音频中所述上宫、上...

【专利技术属性】
技术研发人员:冯洪海宋臣汤青刘晓诚
申请(专利权)人:新绎健康科技有限公司
类型:发明
国别省市:河北,13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1