感冒检测系统、设备、车辆和存储介质技术方案

技术编号:36119512 阅读:12 留言:0更新日期:2022-12-28 14:24
提供了一种感冒检测系统、设备、车辆和存储介质。感冒检测系统包括:语音获取模块,用于获取至少一个发音单元的各语音片段;特征拼接模块,用于将所述至少一个发音单元的各语音片段分别与所述至少一个发音单元的相应参考语音片段进行拼接,得到所述至少一个发音单元的一个或多个拼接特征向量;概率向量模块,用于将所述一个或多个拼接特征向量输入对应第一深度神经网络模型,得到所述至少一个第一深度神经网络模型输出的一个或多个鼻塞概率向量;以及结果检测模块,用于利用第二深度神经网络模型处理所述一个或多个鼻塞概率向量,得到所述第二深度神经网络模型输出的所述受检者的感冒检测结果。感冒检测结果。感冒检测结果。

【技术实现步骤摘要】
感冒检测系统、设备、车辆和存储介质


[0001]本公开涉及人工智能
,特别是涉及一种感冒检测系统、计算机设备、车辆、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]近年来,随着社会经济和科技增长,人们的生活水平得到不断提升,私家车数量的不断提升,人们用车的频数和时长也有了显著提升。当人们健康意识提升,车内健康问题成为不可忽视的重要问题。生活节奏的加快和工作强度的增加,使得人们的抵抗力减弱、长期处于亚健康状态、生病的概率增加。因此让人们及时了解自己的身体状况是非常有必要的。

技术实现思路

[0003]提供一种缓解、减轻或甚至消除上述问题中的一个或多个的机制将是有利的。
[0004]根据本公开的一方面,提供了一种感冒检测系统,包括:语音获取模块,用于获取至少一个发音单元的各语音片段,其中,对于所述至少一个发音单元中的每个发音单元,所述各语音片段包括该发音单元的至少一个语音片段,每个发音单元的所述至少一个语音片段包括受检者的声学特征;特征拼接模块,用于将所述至少一个发音单元的各语音片段分别与所述至少一个发音单元的相应参考语音片段进行拼接,得到所述至少一个发音单元的一个或多个拼接特征向量,其中,每个发音单元对应所述一个或多个拼接特征向量中的至少一个拼接特征向量,每个发音单元的参考语音片段包括所述受检者在非鼻塞状态下的声学特征;概率向量模块,用于将所述一个或多个拼接特征向量输入至少一个第一深度神经网络模型中的对应第一深度神经网络模型,得到所述至少一个第一深度神经网络模型输出的一个或多个鼻塞概率向量,所述一个或多个鼻塞概率向量分别对应所述一个或多个拼接特征向量,其中,所述至少一个第一深度神经网络模型分别针对所述至少一个发音单元被预先训练,所述一个或多个鼻塞概率向量中的每个鼻塞概率向量表征所述至少一个发音单元的各语音片段中的相应语音片段包括所述受检者在鼻塞状态下的声学特征的概率;以及结果检测模块,用于利用第二深度神经网络模型处理所述一个或多个鼻塞概率向量,得到所述第二深度神经网络模型输出的所述受检者的感冒检测结果。
[0005]根据本公开的另一方面,提供了一种计算机设备,包括:至少一个处理器;以及至少一个存储器,其上存储有计算机程序,其中,所述计算机程序在被所述至少一个处理器执行时,使所述至少一个处理器实现包括以下各项的操作:获取至少一个发音单元的各语音片段,其中,对于所述至少一个发音单元中的每个发音单元,所述各语音片段包括该发音单元的至少一个语音片段,每个发音单元的所述至少一个语音片段包括受检者的声学特征;将所述至少一个发音单元的各语音片段分别与所述至少一个发音单元的相应参考语音片段进行拼接,得到所述至少一个发音单元的一个或多个拼接特征向量,其中,每个发音单元对应所述一个或多个拼接特征向量中的至少一个拼接特征向量,每个发音单元的参考语音片段包括所述受检者在非鼻塞状态下的声学特征;将所述一个或多个拼接特征向量输入至
少一个第一深度神经网络模型中的对应第一深度神经网络模型,得到所述至少一个第一深度神经网络模型输出的一个或多个鼻塞概率向量,所述一个或多个鼻塞概率向量分别对应所述一个或多个拼接特征向量,其中,所述至少一个第一深度神经网络模型分别针对所述至少一个发音单元被预先训练,所述一个或多个鼻塞概率向量中的每个鼻塞概率向量表征所述至少一个发音单元的各语音片段中的相应语音片段包括所述受检者在鼻塞状态下的声学特征的概率;以及利用第二深度神经网络模型处理所述一个或多个鼻塞概率向量,得到所述第二深度神经网络模型输出的所述受检者的感冒检测结果。
[0006]根据本公开的又另一方面,提供了一种车辆,包括上述感冒检测系统或上述计算机设备。
[0007]根据本公开的再另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,使处理器实现包括以下各项的操作:获取至少一个发音单元的各语音片段,其中,对于所述至少一个发音单元中的每个发音单元,所述各语音片段包括该发音单元的至少一个语音片段,每个发音单元的所述至少一个语音片段包括受检者的声学特征;将所述至少一个发音单元的各语音片段分别与所述至少一个发音单元的相应参考语音片段进行拼接,得到所述至少一个发音单元的一个或多个拼接特征向量,其中,每个发音单元对应所述一个或多个拼接特征向量中的至少一个拼接特征向量,每个发音单元的参考语音片段包括所述受检者在非鼻塞状态下的声学特征;将所述一个或多个拼接特征向量输入至少一个第一深度神经网络模型中的对应第一深度神经网络模型,得到所述至少一个第一深度神经网络模型输出的一个或多个鼻塞概率向量,所述一个或多个鼻塞概率向量分别对应所述一个或多个拼接特征向量,其中,所述至少一个第一深度神经网络模型分别针对所述至少一个发音单元被预先训练,所述一个或多个鼻塞概率向量中的每个鼻塞概率向量表征所述至少一个发音单元的各语音片段中的相应语音片段包括所述受检者在鼻塞状态下的声学特征的概率;以及利用第二深度神经网络模型处理所述一个或多个鼻塞概率向量,得到所述第二深度神经网络模型输出的所述受检者的感冒检测结果。
[0008]根据本公开的又另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时,使处理器实现包括以下各项的操作:获取至少一个发音单元的各语音片段,其中,对于所述至少一个发音单元中的每个发音单元,所述各语音片段包括该发音单元的至少一个语音片段,每个发音单元的所述至少一个语音片段包括受检者的声学特征;将所述至少一个发音单元的各语音片段分别与所述至少一个发音单元的相应参考语音片段进行拼接,得到所述至少一个发音单元的一个或多个拼接特征向量,其中,每个发音单元对应所述一个或多个拼接特征向量中的至少一个拼接特征向量,每个发音单元的参考语音片段包括所述受检者在非鼻塞状态下的声学特征;将所述一个或多个拼接特征向量输入至少一个第一深度神经网络模型中的对应第一深度神经网络模型,得到所述至少一个第一深度神经网络模型输出的一个或多个鼻塞概率向量,所述一个或多个鼻塞概率向量分别对应所述一个或多个拼接特征向量,其中,所述至少一个第一深度神经网络模型分别针对所述至少一个发音单元被预先训练,所述一个或多个鼻塞概率向量中的每个鼻塞概率向量表征所述至少一个发音单元的各语音片段中的相应语音片段包括所述受检者在鼻塞状态下的声学特征的概率;以及利用第二深度神经网络模型处理所述一个或多个鼻塞概率向量,得到所述第二深度神经网络模型输出的所述受检者的感冒检测结果。
[0009]根据在下文中所描述的实施例,本公开的这些和其它方面将是清楚明白的,并且将参考在下文中所描述的实施例而被阐明。
附图说明
[0010]在下面结合附图对于示例性实施例的描述中,本公开的更多细节、特征和优点被公开,在附图中:
[0011]图1是图示出根据示例性实施例的可以在其中实施本文描述的各种方法的示例系统的示意图;
[0012]图2是图示出根据示例性实施例的感冒检测系统的示意性框图;
[0013]图3A和图3B是图示出图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种感冒检测系统,包括:语音获取模块,用于获取至少一个发音单元的各语音片段,其中,对于所述至少一个发音单元中的每个发音单元,所述各语音片段包括该发音单元的至少一个语音片段,每个发音单元的所述至少一个语音片段包括受检者的声学特征;特征拼接模块,用于将所述至少一个发音单元的各语音片段分别与所述至少一个发音单元的相应参考语音片段进行拼接,得到所述至少一个发音单元的一个或多个拼接特征向量,其中,每个发音单元对应所述一个或多个拼接特征向量中的至少一个拼接特征向量,每个发音单元的参考语音片段包括所述受检者在非鼻塞状态下的声学特征;概率向量模块,用于将所述一个或多个拼接特征向量输入至少一个第一深度神经网络模型中的对应第一深度神经网络模型,得到所述至少一个第一深度神经网络模型输出的一个或多个鼻塞概率向量,所述一个或多个鼻塞概率向量分别对应所述一个或多个拼接特征向量,其中,所述至少一个第一深度神经网络模型分别针对所述至少一个发音单元被预先训练,所述一个或多个鼻塞概率向量中的每个鼻塞概率向量表征所述至少一个发音单元的各语音片段中的相应语音片段包括所述受检者在鼻塞状态下的声学特征的概率;以及结果检测模块,用于利用第二深度神经网络模型处理所述一个或多个鼻塞概率向量,得到所述第二深度神经网络模型输出的所述受检者的感冒检测结果。2.根据权利要求1所述的系统,其中,所述至少一个发音单元中的每个发音单元包括音素,并且其中,所述获取至少一个发音单元的各语音片段,包括:获取所述受检者的语音音频流;将所述语音音频流输入语音识别模型,得到所述语音识别模型输出的包括多个音素的语音片段序列;以及将所述语音片段序列中对应于相应至少一个目标音素的语音片段作为所述至少一个发音单元的各语音片段。3.根据权利要求2所述的系统,其中,所述至少一个发音单元的各语音片段包括对应于同一目标音素的多个语音片段,使得所述至少一个第一深度神经网络模型中的对应第一深度神经网络模型输出与所述多个语音片段分别对应的多个鼻塞概率向量,并且其中,所述利用第二深度神经网络模型处理所述一个或多个鼻塞概率向量,包括:计算所述多个鼻塞概率向量的均值向量;以及将所述均值向量输入所述第二深度神经网络模型。4.根据权利要求1所述的系统,其中,所述将所述至少一个发音单元的各语音片段分别与所述至少一个发音单元的相应参考语音片段进行拼接包括:将所述至少一个发音单元的各语音片段转换成相应的第一频域表示;将所述至少一个发音单元的各参考语音片段转换成相应的第二频域表示;以及将所述第一频域表示中的每个第一频域表示与所述第二频域表示中的对应第二频域表示进行拼接,得到所述至少一个发音单元的所述一个或多个拼接特征向量,其中,该对应第二频域表示与该第一频域表示对应于同一发音单元。5.根据权利要求4所述的系统,还包括:语速调整模块,用于调整所述至少一个发音单元的各语音片段的音频采样率以供所述特征拼接模块进行拼接,其中,经调整后的所述至少一个发音单元的各语音片段与所述至
少一个发音单元的各参考语音片段中的对应参考语音片段具有相同的时长。6.根据权利要求1

5中任一项所述的系统,其中,所述至少一个第一深度神经网络模型中的每个第一深度神经网络模型包括二分类深度神经网络模型。7.一种计算机设备,包括:至少一个处理器;以及至少一个存储器,其上存储有计算机程序,其中,所述计算机程序在被所述至少一个处理器执行时,使所述至少一个处理器实现包括以下各项的操作:获取至少一个发音单元的各语音片段,其中,对于所述至少一个发音单元中的每个发音单元,所述各语音片段包括该发音单元的至少一个语音片段,每个发音单元的所述至少一个语音片段包括受检者的声学特征;将所述至少一个发音单元的各语音片段分别与所述至少一个发音单元的相应参考...

【专利技术属性】
技术研发人员:徐培来
申请(专利权)人:北京宾理信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1