基于语音样本对准的诊断技术制造技术

技术编号:30426385 阅读:14 留言:0更新日期:2021-10-24 17:07
获得参考样本特征向量,该参考样本特征向量量化至少一个参考语音样本(44)的不同相应部分的声学特征,该参考语音样本(44)是在受试者的生理状态已知时由受试者(22)在第一时间产生的。接收在受试者的生理状态未知时由受试者在第二时间产生的至少一个测试语音样本(56)。计算量化测试语音样本的不同相应部分(58)的声学特征的测试样本特征向量(60)。在预定义的约束条件下,测试样本特征向量被映射到参考样本特征向量中的相应的参考样本特征向量,使得测试样本特征向量和参考样本特征向量中的相应的参考样本特征向量之间的总距离被最小化。响应于该映射,生成指示受试者在第二时间的生理状态的输出。时间的生理状态的输出。时间的生理状态的输出。

【技术实现步骤摘要】
【国外来华专利技术】基于语音样本对准的诊断技术
专利

[0001]本专利技术总体上涉及医学诊断,特别是关于影响受试者的语音的生理状况的医学诊断。
[0002]背景
[0003]Sakoe和Chiba在声学、语音和信号处理IEEE学报26.2(1978):43

49的“Dynamic Programming Algorithm Optimization for Spoken Word Recognition”中就一种用于口语词识别的基于最佳动态规划(DP)的时间归一化算法作了报告,该文章通过引用并入本文。首先,使用时间翘曲函数(warping function)给出了时间归一化的一般原理。然后,两个时间归一化的距离定义(称为对称形式和非对称形式)从该原理中被推导出来。通过理论讨论和实验研究,将这两种形式进行了相互比较。对称形式算法的优越性得以确立。引入了一种称为斜率约束的技术,其中翘曲函数的斜率被限制以便提高不同类别的词之间的区分度。
[0004]Rabiner、Lawrence R.在IEEE 77.2会议录(1989):257

286“A tutorial on hidden Markov models and selected applications in speech recognition”中回顾了统计建模类型的理论方面,并展示了它们如何被应用于语音的机器识别中的选定问题,该文章通过引用并入本文。
[0005]美国专利7,457,753描述了一种用于远程评估用户的系统。该系统包括应用软件,该应用软件驻留在服务器上,并且被布置为通过网络与操作客户端设备的用户交互,以获得用户语音的一个或更多个样本信号。数据存储库(datastore)被布置为存储与用户的细节相关联的用户语音样本。特征提取引擎被布置为从相应的语音样本中提取一个或更多个第一特征。比较器被布置为将从语音样本中提取的第一特征与从一个或更多个参考样本中提取的第二特征进行比较,并提供第一特征和第二特征之间的任何差异的度量,以用于评估用户。
[0006]美国专利申请公开2009/0099848描述了一种用于痴呆症的被动诊断的系统和方法。通过纵向统计测量自动识别痴呆症的临床和心理测量指标,并使用数学方法来跟踪语言变化和/或患者音频特征的性质。所公开的系统和方法包括多层处理单元,其中记录的音频数据的初始处理在本地单元中进行处理。经处理的和需要的原始数据还被传输到中央单元,该中央单元对音频数据进行深入分析。
[0007]Lotan等人的美国专利申请公开2015/0216448描述了一种用于测量用户的肺活量和耐力以检测慢性心力衰竭、COPD或哮喘的方法。该方法包括在用户的移动通信设备上提供客户端应用,所述客户端应用包括用于以下项的可执行的计算机代码:指示用户用空气填充他的肺,并在呼气时发出一定响度(分贝)范围内的语声;由移动通信设备接收并记录所述用户的语声;停止记录语声;测量在所述响度范围内的语声接收时间的长度;以及在移动通信设备屏幕上显示该长度。
[0008]专利技术概述
[0009]根据本专利技术的一些实施例,提供了一种方法,该方法包括获得从一个或更多个参
考语音样本构建的至少一个语音模型,该参考语音样本是在受试者的生理状态已知时由受试者在第一时间产生的。语音模型包括(i)参考语音样本中呈现的一个或更多个声学状态,声学状态与相应的局部距离函数相关联,使得给定局部距离函数域内的任何声学特征向量时,每个声学状态的局部距离函数返回局部距离,该局部距离指示给定声学特征向量和声学状态之间的对应程度,以及(ii)如果语音模型包括多个声学状态,则允许声学状态之间的转换。该方法还包括接收在受试者的生理状态未知时由受试者在第二时间产生的至少一个测试语音样本,并计算量化测试语音样本的不同相应部分的声学特征的多个测试样本特征向量。该方法还包括,基于局部距离函数和所允许的转换,通过将测试样本特征向量映射到声学状态中的相应的声学状态,使得测试样本特征向量和声学状态中的相应的声学状态之间的总距离最小化,来将测试语音样本映射到声学状态的最小距离序列,该总距离基于测试样本特征向量和声学状态中的相应的声学状态之间的相应局部距离。该方法还包括,响应于将测试语音样本映射到声学状态的最小距离序列,生成指示受试者在第二时间的生理状态的输出。
[0010]在一些实施例中,该方法还包括接收参考语音样本,并且获得语音模型包括通过从参考语音样本构建语音模型来获得语音模型。
[0011]在一些实施例中,总距离基于相应的局部距离的总和。
[0012]在一些实施例中,总距离是相应的局部距离的总和。
[0013]在一些实施例中,
[0014]该总和是第一总和,
[0015]该模型还为允许的转换定义相应的转换距离,并且
[0016]总距离是(i)第一总和与(ii)包括在声学状态的最小距离序列中的那些允许的转换的转换距离的第二总和。
[0017]在一些实施例中,生成输出包括:
[0018]将总距离与预定阈值进行比较;和
[0019]响应于比较生成输出。
[0020]在一些实施例中,每个声学状态的局部距离函数返回取决于给定声学特征向量对应于声学状态的估计似然性(estimated likelihood)的负对数的值。
[0021]在一些实施例中,参考语音样本是在受试者的生理状态相对于特定生理状况稳定时产生的。
[0022]在一些实施例中,
[0023]参考语音样本是第一参考语音样本,语音模型是第一语音模型,声学状态是第一声学状态,最小距离序列是第一最小距离序列,并且总距离是第一总距离,
[0024]该方法还包括:
[0025]接收在受试者的生理状态相对于特定生理状况不稳定时由受试者产生的一个或更多个第二参考语音样本;
[0026]基于第二参考语音样本,构建至少一个第二语音模型,该第二语音模型包括在第二参考语音样本中呈现的一个或更多个第二声学状态;
[0027]通过将测试样本特征向量映射到第二声学状态中的相应的第二声学状态,使得测试样本特征向量和第二声学状态中的相应的第二声学状态之间的第二总距离最小化,来将
测试语音样本映射到第二声学状态的第二最小距离序列;和
[0028]将第二总距离与第一总距离进行比较,以及
[0029]生成输出包括响应于将第二总距离与第一总距离进行比较而生成输出。
[0030]在一些实施例中,参考语音样本是在受试者的生理状态相对于特定生理状况不稳定时产生的。
[0031]在一些实施例中,参考语音样本和测试语音样本包括相同的预定话语。
[0032]在一些实施例中,
[0033]参考语音样本包括受试者的自由语音,
[0034]构建至少一个语音模型包括:
[0035]识别自由语音中的多个不同语音单元;
[0036]为所识别的语音单元构建相应的语音单元模型;和...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:获得多个参考样本特征向量,所述多个参考样本特征向量量化至少一个参考语音样本的不同相应部分的声学特征,所述参考语音样本是在受试者的生理状态已知时由受试者在第一时间产生的;接收在受试者的生理状态未知时由受试者在第二时间产生的至少一个测试语音样本;计算量化所述测试语音样本的不同相应部分的所述声学特征的多个测试样本特征向量;在预定义的约束条件下,通过将所述测试样本特征向量映射到所述参考样本特征向量中的相应的参考样本特征向量,使得所述测试样本特征向量和所述参考样本特征向量中的所述相应的参考样本特征向量之间的总距离最小化,来将所述测试语音样本映射到所述参考语音样本;和响应于将所述测试语音样本映射到所述参考语音样本,生成指示受试者在所述第二时间的生理状态的输出。2.根据权利要求1所述的方法,还包括接收所述参考语音样本,其中,获得所述参考样本特征向量包括通过基于所述参考语音样本计算所述参考样本特征向量来获得所述参考样本特征向量。3.根据权利要求1所述的方法,其中,所述总距离是从所述测试样本特征向量和所述参考样本特征向量中的所述相应的参考样本特征向量之间的相应局部距离推导出的。4.根据权利要求3所述的方法,其中,所述总距离是所述局部距离的加权总和。5.根据权利要求4所述的方法,其中,将所述测试语音样本映射到所述参考语音样本包括使用动态时间规整(DTW)算法将所述测试语音样本映射到所述参考语音样本。6.根据权利要求1所述的方法,其中,生成所述输出包括:将所述总距离与预定阈值进行比较;和响应于所述比较生成所述输出。7.根据权利要求1所述的方法,其中,所述参考语音样本是在受试者的所述生理状态相对于特定生理状况稳定时产生的。8.根据权利要求7所述的方法,其中,所述参考语音样本是第一参考语音样本,所述参考样本特征向量是第一参考样本特征向量,并且所述总距离是第一总距离,其中,所述方法还包括:接收在受试者的所述生理状态相对于所述特定生理状况不稳定时由受试者产生的至少一个第二参考语音样本;计算量化所述第二参考语音样本的不同相应部分的所述声学特征的多个第二参考样本特征向量;在所述预定义的约束条件下,通过将所述测试样本特征向量映射到所述第二参考样本特征向量中的相应的第二参考样本特征向量,使得所述测试样本特征向量和所述第二参考样本特征向量中的所述相应的第二参考样本特征向量之间的第二总距离最小化,来将所述测试语音样本映射到所述第二参考语音样本;和将所述第二总距离与所述第一总距离进行比较,以及
其中,生成所述输出包括响应于将所述第二总距离与所述第一总距离进行比较而生成所述输出。9.根据权利要求1所述的方法,其中,所述参考语音样本是在受试者的所述生理状态相对于特定生理状况不稳定时产生的。10.根据权利要求1所述的方法,其中,所述参考语音样本和所述测试语音样本包括相同的预定话语。11.根据权利要求1所述的方法,其中,所述参考语音样本包括受试者的自由语音,并且其中,所述测试语音样本包括包含在所述自由语音中的多个语音单元。12.根据权利要求1

11中任一项所述的方法,其中,所述总距离是第一总距离,并且其中,生成所述输出包括:计算所述测试样本特征向量和所述参考样本特征向量中的所述相应的参考样本特征向量之间的第二总距离,所述第二总距离不同于所述第一总距离;和响应于所述第二总距离生成所述输出。13.根据权利要求12所述的方法,其中,所述第一总距离是所述测试样本特征向量和所述参考样本特征向量中的所述相应的参考样本特征向量之间的相应局部距离的第一加权总和,其中,所述局部距离的第一加权总和由相应的第一权重加权,以及其中,所述第二总距离是所述相应局部距离的第二加权总和,其中,所述局部距离由相应的第二权重加权,所述第二权重中的至少一个第二权重不同于所述第一权重中的对应的第一权重。14.根据权利要求13所述的方法,还包括:将所述参考样本特征向量与相应的声学语音单元(APU)相关联;和响应于所述APU选择所述第二权重。15.根据权利要求14所述的方法,其中,将所述参考样本特征向量与所述APU相关联包括通过将语音识别算法应用于所述参考语音样本来将所述参考样本特征向量与所述APU相关联。16.根据权利要求12所述的方法,其中,所述第一总距离基于所述测试样本特征向量和所述参考样本特征向量中的所述相应的参考样本特征向量之间的相应的第一局部距离,...

【专利技术属性】
技术研发人员:伊兰
申请(专利权)人:科蒂奥医疗公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1