一种基于声音的体质辨识方法及设备技术

技术编号:20553134 阅读:51 留言:0更新日期:2019-03-14 01:24
本发明专利技术公开一种基于声音的体质辨识方法及设备,其特征在于设备包括拾音器、触摸屏、智能信息处理器和数据存储器。其特征在于方法包括以下步骤:[1]拾音器采集用户的声音。[2]输入声音到声音预处理模型,获得处理后的声音。[3]输入处理后的声音到特征提取模型,提取处理后声音的特征数据。[4]输入特征数据到体质分类模型,获得体质类型。本发明专利技术的有益之处在于配合其它的体质辨识方法,提高体质识别的准确率,使用方便,效率高。

A Sound-based Physical Identification Method and Equipment

The invention discloses a sound-based body identification method and device, which is characterized in that the device comprises a pickup, a touch screen, an intelligent information processor and a data memory. The method is characterized in that the method comprises the following steps: (1) the pickup collects the user's voice. [2] Input the sound into the sound preprocessing model to obtain the processed sound. [3] Input the processed voice into the feature extraction model and extract the feature data of the processed voice. [4] Input characteristic data to physique classification model to obtain physique type. The advantages of the present invention lie in improving the accuracy of physical identification, convenient use and high efficiency by cooperating with other methods of physical identification.

【技术实现步骤摘要】
一种基于声音的体质辨识方法及设备
本专利技术属于中医医疗器械和人工智能
,特别涉及一种基于声音的体质辨识方法及设备。
技术介绍
中医体质学认为体质是人体在先天条件和后天生活习惯的基础上表现出来的相对稳定的固有特性,包括了人的形态结构和心理气质。目前的主要体质辨识方法是通过回答一组标准的问题来判断体质类型,缺点是识别周期比较长,降低了效率。其次是由于被试的主观性,影响了辨识的准确率。因此需要采用更加智能化的体质辨识方法。由于人体内发出的各种声音是在脏腑生理和病理活动中产生的,因此声音的变化能反映脏腑的生理和病理变化,在临床上可推断正气的盛衰和疾病类别。闻诊就包括听声音。听声音是指诊察病人的声音、语言、呼吸、咳嗽、呕吐、呃逆、嗳气、太息、喷嚏、肠鸣等各种声响,主要是根据声音的大小、高低、清浊,区别寒热虚实。通常,声高气粗重浊多属实证,反之则属虚证。语言错乱多属心之病变,呼吸、咳嗽、喷嚏多与肺病有关,呕吐、呃逆、嗳气多是胃失和降,胃气上逆的表现。太息多与肝郁有关。中医医生运用自己的听觉对病人发出的声音进行诊察,以推断疾病类别。人体内发出的各种声音均是在脏腑生理和病理活动中产生的,如五声(呼、笑、歌、哭、呻)和五音(角、徵、宫、商、羽)都与五脏相应,是五脏功能变化的反映,因而声音的变化可反映出内在病变,据此预测疾病种类。但是目前还没有用到声音来辨识患者体质的设备,也没有很有效的声音体质辨识方法。
技术实现思路
本专利技术旨在提供一种基于声音的体质辨识方法及设备,解决现有技术的体质辨识不准确的问题。一种基于声音的体质辨识方法及设备,其特征在于设备包括人体检测器、拾音器、触摸屏、智能信息处理器和数据存储器。[1]拾音器用来录音用户的声音;[2]智能信息处理器主要完成声音信号的处理,包括声音预处理、声音特征提取和体质类型分类;[3]数据存储器用来保存声音预处理模型、特征提取模型和体质辨识模型,以及识别的结果。一种基于声音的体质辨识方法及设备,其特征在于方法包括以下步骤[1]采集用户的声音;[2]声音预处理,其输入是用户声音,输出是预处理后的声音;[3]特征提取,提取预处理后声音的特征数据;[4]体质分类,输入声音的特征数据,输出体质类型。本专利技术一种基于声音的体质辨识方法及设备的好处在于:[1]通过对话实现体质辨识,应用场景多,使用方便;[2]增加了一种辨识体质的方法,以与其它辨识体质方法合参,提高体质辨识的准确性。实施案例(1)下面将结合本专利技术实施案例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,目的是为了使公众更好地理解所述
技术实现思路
,而并非对技术方案的限制。一种基于声音的体质辨识方法及设备,实施案例硬件选用华为公司的智能手机:华为P20,它本身带有拾音器、触摸屏、无线通讯卡、智能信息处理器和数据存储器。P20本身有WIFI和4G,利用它们与云端的服务器通讯,传递数据。一种基于声音的体质辨识方法及设备,其特征在于方法包括以下步骤S01采集用户的声音S02声音预处理,其输入是用户声音,输出是预处理后的声音S03特征提取,提取预处理后声音的特征数据S04体质分类,输入声音的特征数据,输出是体质类型步骤[S01]拾音器采集用户的声音直接采用华为p20录音机的采集用户的声音。步骤[S02]声音预处理声音预处理的目的是让语音由模拟信号转变为可供计算机存储使用的数字信号,语音预处理的方式主要有语音信息采样、语音信息量化以及语音分帧加窗。语音信号本质上是一个连续的模拟信号,而采样的过程即是按照一定的时间间隔,定时去获取模拟信号的模拟量值,这样就将一个连续的模拟信号转换为离散的模拟信号。值得一提的是,在采样的时间间隔上有很多种方式,一般我们把频率分别为11.25kHz、22.05kHz和44.1kHz的采样率划分为语音的低、中、高三种品质,而高于48kHz的采样率已经超过了人耳的分辨范围,所以不具备太大意义,还会增加存储成本和计算成本,所以我们选取中等品质这一频率段的语音数据。语音采样完成后还需要进行量化,量化的目的是让每个离散的语音模拟信号转换为数字信号,量化的相关概念是量化位数,常见的有8位、12位、16位等,位数越多则精度越高,同样存储代价就越大,我们采用16位。分帧与加窗语音信号是一个非稳态、时变的信号,但语音是由声门的激励脉冲通过声道形成的,而声道中肌肉运动的缓慢性决定了在较短的时间内,我们是可以把语音当成是稳态、时不变的,经科学研究,这个时间段一般为10-30ms,所以我们取10ms对语音信号进行分帧,这样每一帧就代表一个相对稳定的状态,同时也因为语音本质上是连续的,所以帧与帧之间是有一定关联的,因而在实际研究中,帧与帧之间是有重叠的,这样可以保证相邻两帧间的平滑过渡。而在这一过程中,用一个有限长度的可以移动的窗口来进行加权从而最终达到分帧的目的,这就是加窗操作。常见的窗函数有矩形窗、汉明窗以及和海宁窗。三种窗函数的函数公式如下所示:其中L代表窗长汉明窗:(2-1)海宁窗:(2-2)矩形窗:(2-3)矩形窗的优点在于主瓣较集中,但同时其旁瓣较高且有负旁瓣,在变换中会导致高频泄漏。海宁窗和汉明窗只是两者系数不同,汉明窗与海宁窗相对矩形窗来说主瓣加宽,旁瓣减小,可以减少泄漏,但同时也导致了频率的分辨力下降。本实施案例选择汉明窗。步骤[S03]语音特征提取特征提取从预处理过后的语音数据中提取能够最大程度代表语音特性的一组特征,从而为后面的特征选择和体质识别模型的训练奠定基础。目前已有的语音特征可以分成三个类别:韵律特征,谱特征,其它特征。我们提取的特征包括以下两类,然后组合成一个特征向量:韵律特征[1]基于基音频率的特征,包含基音频率的包络,基音频率的线性预测系数;[2]共振峰特征,包含一阶共振峰,二阶共振峰,以及共振峰的带宽等;[3]基于能量的特征;[4]时间特征,包含说话部分和不说话部分的比值,最长说话的时间等;[5]发音清晰程度的特征;[6]声音级别:信号幅度,能量被证明与声音级别有很大的关系;[7]短语,音素,单词以及这些特征的边界;[8]时间结构。谱特征谱特征是语音信号的短时表示。使用短时表示的原因是语音信号的产生过程是多个发音器官共同作用的结果。因为发音器官的物理特性,使得发音器官难以在短时发生较大的变化,一般认为在时间5到50毫秒间,语音信号认为是平稳的,即其谱特性变化不大,本实施案例选择10毫秒。我们提取的谱特征有短时傅里叶变换,线性预测系数(LinearPredictorCoefficients,LPC),Mel倒谱系数(MelFrequencyCepstrumCoefficients,MFCC),线谱对参数(LineSpectrumPair,LSP),感知线性预测倒谱系数(PerceptualLinearPredictiveCepstralCoefficients,PLP),线性预测倒谱系数(LinearPredictorCepstralCoefficients,LPCC)。单边自相关线性预测倒谱系数(One-sideAutocorrelationLinearPredictorCepstralCoefficients,OSALPCC)。过零幅度峰值(ZerosCrossingPeakA本文档来自技高网
...

【技术保护点】
1.一种基于声音的体质辨识方法及设备,其特征在于设备包括拾音器、触摸屏、智能信息处理器和数据存储器[1]拾音器用来录音用户的声音;[2]智能信息处理器主要完成声音信号的处理,并完成权利要求4所述的体质辨识方法,包括声音预处理、声音特征提取和体质分类;[3]数据存储器用来保存声音预处理模型、特征提取模型和体质辨识模型,以及识别的结果。

【技术特征摘要】
1.一种基于声音的体质辨识方法及设备,其特征在于设备包括拾音器、触摸屏、智能信息处理器和数据存储器[1]拾音器用来录音用户的声音;[2]智能信息处理器主要完成声音信号的处理,并完成权利要求4所述的体质辨识方法,包括声音预处理、声音特征提取和体质分类;[3]数据存储器用来保存声音预处理模型、特征提取模型和体质辨识模型,以及识别的结果。2.根据权利要求1所述的一种基于声音的体质辨识方法及设备,其特征在于:智能信息处理器调用的声音预处理、声音特征提取和体质分类模型保存在设备的数据存储器。3.根据权利要求1所述的一种基于声音的体质辨识方法及设备,其特征在于:智能信息处理器调用的声音预处理、声音特征提取和体质分类模型保存在云服务器。4.一种基于声音的体质辨识方法及设备,其特征在于方法包括以下步骤采集用户的声音;[1]声音预处理,输入是用户声音,输出是预处理后的声音;[2]特征提取,提取预处理...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:广州华久信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1