基于语音样本对准的诊断技术制造技术

技术编号：30426385 阅读：14 留言：0更新日期：2021-10-24 17:07

获得参考样本特征向量，该参考样本特征向量量化至少一个参考语音样本(44)的不同相应部分的声学特征，该参考语音样本(44)是在受试者的生理状态已知时由受试者(22)在第一时间产生的。接收在受试者的生理状态未知时由受试者在第二时间产生的至少一个测试语音样本(56)。计算量化测试语音样本的不同相应部分(58)的声学特征的测试样本特征向量(60)。在预定义的约束条件下，测试样本特征向量被映射到参考样本特征向量中的相应的参考样本特征向量，使得测试样本特征向量和参考样本特征向量中的相应的参考样本特征向量之间的总距离被最小化。响应于该映射，生成指示受试者在第二时间的生理状态的输出。时间的生理状态的输出。时间的生理状态的输出。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】基于语音样本对准的诊断技术
专利

[0001]本专利技术总体上涉及医学诊断，特别是关于影响受试者的语音的生理状况的医学诊断。
[0002]背景
[0003]Sakoe和Chiba在声学、语音和信号处理IEEE学报26.2(1978)：43
‑
49的“Dynamic Programming Algorithm Optimization for Spoken Word Recognition”中就一种用于口语词识别的基于最佳动态规划(DP)的时间归一化算法作了报告，该文章通过引用并入本文。首先，使用时间翘曲函数(warping function)给出了时间归一化的一般原理。然后，两个时间归一化的距离定义(称为对称形式和非对称形式)从该原理中被推导出来。通过理论讨论和实验研究，将这两种形式进行了相互比较。对称形式算法的优越性得以确立。引入了一种称为斜率约束的技术，其中翘曲函数的斜率被限制以便提高不同类别的词之间的区分度。
[0004]Rabiner、Lawrence R.在IEEE 77.2会议录(1989)：257
‑
286“A tutorial on hidden Markov models and selected applications in speech recognition”中回顾了统计建模类型的理论方面，并展示了它们如何被应用于语音的机器识别中的选定问题，该文章通过引用并入本文。
[0005]美国专利7,457,753描述了一种用于远程评估用户的系统。该系

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法，包括：获得多个参考样本特征向量，所述多个参考样本特征向量量化至少一个参考语音样本的不同相应部分的声学特征，所述参考语音样本是在受试者的生理状态已知时由受试者在第一时间产生的；接收在受试者的生理状态未知时由受试者在第二时间产生的至少一个测试语音样本；计算量化所述测试语音样本的不同相应部分的所述声学特征的多个测试样本特征向量；在预定义的约束条件下，通过将所述测试样本特征向量映射到所述参考样本特征向量中的相应的参考样本特征向量，使得所述测试样本特征向量和所述参考样本特征向量中的所述相应的参考样本特征向量之间的总距离最小化，来将所述测试语音样本映射到所述参考语音样本；和响应于将所述测试语音样本映射到所述参考语音样本，生成指示受试者在所述第二时间的生理状态的输出。2.根据权利要求1所述的方法，还包括接收所述参考语音样本，其中，获得所述参考样本特征向量包括通过基于所述参考语音样本计算所述参考样本特征向量来获得所述参考样本特征向量。3.根据权利要求1所述的方法，其中，所述总距离是从所述测试样本特征向量和所述参考样本特征向量中的所述相应的参考样本特征向量之间的相应局部距离推导出的。4.根据权利要求3所述的方法，其中，所述总距离是所述局部距离的加权总和。5.根据权利要求4所述的方法，其中，将所述测试语音样本映射到所述参考语音样本包括使用动态时间规整(DTW)算法将所述测试语音样本映射到所述参考语音样本。6.根据权利要求1所述的方法，其中，生成所述输出包括：将所述总距离与预定阈值进行比较；和响应于所述比较生成所述输出。7.根据权利要求1所述的方法，其中，所述参考语音样本是在受试者的所述生理状态相对于特定生理状况稳定时产生的。8.根据权利要求7所述的方法，其中，所述参考语音样本是第一参考语音样本，所述参考样本特征向量是第一参考样本特征向量，并且所述总距离是第一总距离，其中，所述方法还包括：接收在受试者的所述生理状态相对于所述特定生理状况不稳定时由受试者产生的至少一个第二参考语音样本；计算量化所述第二参考语音样本的不同相应部分的所述声学特征的多个第二参考样本特征向量；在所述预定义的约束条件下，通过将所述测试样本特征向量映射到所述第二参考样本特征向量中的相应的第二参考样本特征向量，使得所述测试样本特征向量和所述第二参考样本特征向量中的所述相应的第二参考样本特征向量之间的第二总距离最小化，来将所述测试语音样本映射到所述第二参考语音样本；和将所述第二总距离与所述第一总距离进行比较，以及
其中，生成所述输出包括响应于将所述第二总距离与所述第一总距离进行比较而生成所述输出。9.根据权利要求1所述的方法，其中，所述参考语音样本是在受试者的所述生理状态相对于特定生理状况不稳定时产生的。10.根据权利要求1所述的方法，其中，所述参考语音样本和所述测试语音样本包括相同的预定话语。11.根据权利要求1所述的方法，其中，所述参考语音样本包括受试者的自由语音，并且其中，所述测试语音样本包括包含在所述自由语音中的多个语音单元。12.根据权利要求1
‑
11中任一项所述的方法，其中，所述总距离是第一总距离，并且其中，生成所述输出包括：计算所述测试样本特征向量和所述参考样本特征向量中的所述相应的参考样本特征向量之间的第二总距离，所述第二总距离不同于所述第一总距离；和响应于所述第二总距离生成所述输出。13.根据权利要求12所述的方法，其中，所述第一总距离是所述测试样本特征向量和所述参考样本特征向量中的所述相应的参考样本特征向量之间的相应局部距离的第一加权总和，其中，所述局部距离的第一加权总和由相应的第一权重加权，以及其中，所述第二总距离是所述相应局部距离的第二加权总和，其中，所述局部距离由相应的第二权重加权，所述第二权重中的至少一个第二权重不同于所述第一权重中的对应的第一权重。14.根据权利要求13所述的方法，还包括：将所述参考样本特征向量与相应的声学语音单元(APU)相关联；和响应于所述APU选择所述第二权重。15.根据权利要求14所述的方法，其中，将所述参考样本特征向量与所述APU相关联包括通过将语音识别算法应用于所述参考语音样本来将所述参考样本特征向量与所述APU相关联。16.根据权利要求12所述的方法，其中，所述第一总距离基于所述测试样本特征向量和所述参考样本特征向量中的所述相应的参考样本特征向量之间的相应的第一局部距离，...

【专利技术属性】
技术研发人员：伊兰，
申请(专利权)人：科蒂奥医疗公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人