用于监测或诊断健康状况的语音分析制造技术

技术编号：37498111 阅读：21 留言：0更新日期：2023-05-07 09:35

本发明专利技术涉及训练用于执行用于监测或诊断健康状况的语音分析的机器学习模型的计算机实现的方法。该方法使用包括音频语音数据的训练数据，并且包括获得一个或多个语言表示，每个语言表示对音频语音数据的子词，词或多个词序列进行编码。获得一个或多个音频表示，每个音频表示对音频语音数据的片段的音频内容进行编码；将语言表示和音频表示组合成输入序列，包括：音频语音数据的一个或多个词或子词的序列的语言表示；以及音频语音数据的片段的音频表示，其中这些片段一起包含一个或多个词或子词的序列。该方法还包括使用无监督学习来训练机器学习模型，以将输入序列映射到目标输出，以学习音频语音数据的组合音频语言表示，以供在用于监测或诊断健康状况的语音分析中使用。使用。使用。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于监测或诊断健康状况的语音分析

[0001]本专利技术涉及一种用于训练用于执行语音分析的机器学习模型的方法和系统，特别是用于监测或诊断健康状况。本专利技术还涉及将经训练的机器学习模型应用于患者语音数据以用于监测或诊断健康状况的方法以及包含经训练的模型的系统。

技术介绍

[0002]机器学习领域的快速发展，以及增加的计算能力和大型临床数据集的可用性，导致在医疗和医疗保健数据的分析，解释和理解中增加计算方法的应用。用于转化医疗行业的机器学习的潜力被广泛地认识到，并且越来越多地被视为潜在的解决方案，以增加由于生长的老化群体所致的健康护理中面临的压力。
[0003]人工智能在医疗保健中的应用包括使用机器学习来预测用于药物发现的分子化合物和靶的药物性质；对医学图像的模式识别和分割技术，以实现疾病进展的更快诊断和跟踪；以及在多模式数据源上开发深度学习技术，诸如组合基因组和临床数据以检测新的预测模型。
[0004]最近的发展已经尝试分析口语以提取临床上有意义的信息。这涉及语音的语言成分的基于文本或字符的分析(例如，语义，...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实施的方法，训练执行言语分析的机器学习模型，用于健康问题的监测或诊断，所述方法使用包括语音数据的训练数据，所述方法包括：获得一个或多个语言表征，所述语言表征分别编码语音数据的一个子词、单词或多词序列；获得一个或多个音频表征，所述音频表征分别编码一个语音数据段的音频内容；将所述语言表征和音频表征组合成一个输入序列，所述输入序列包括：语音数据一个或多个单词或子词构成的序列的语言表征；以及语音数据段的音频表征，其中这些数据段共同包含所述一个或多个单词或子词构成的序列；所述方法进一步包括：使用无监督学习来训练机器模型，学习输入序列的组合音频
‑
语言表征，以执行言语分析，用于健康问题的监测或诊断。2.如权利要求1所述的方法，其特征在于，使用无监督学习训练机器学习模型包括训练机器模型来预测输入序列或语音数据的被保留部分或属性。3.如权利要求1或权利要求2所述的方法，其特征在于，训练机器学习模型包括掩膜或损坏输入序列中的一个或多个语言和/或音频表征，然后训练机器学习模型来预测被掩膜或损坏的语言和/或音频表征。4.如任何前述权利要求所述的方法，其特征在于，组合语言保证和音频表征包括：形成一个语言序列，所述语言系列包括由语音数据一个或多个单词或子词构成的序列的语言表征；形成一个音频序列，所述音频序列包括语音数据段的音频表征，这些数据段共同包含所述一个或多个单词或子词构成的序列；并且通过如下一种或多种方式组合所述语言序列和音频序列：沿着任何维度将语言序列和音频序列联接起来；将语言序列和音频序列求和；对音频序列和/或语言序列执行线性或非线性转换通过输入到初始神经网络层来组合语言序列和音频序列。5.如权利要求4所述方法，其特征在于，组合语言序列和音频序列包括：训练一个神经网络层，通过如下方法将音频序列和语言序列对齐：对于每个语言表征，使用时间对齐信息选择一个或多个相关音频表征，其中模型通过确定所述语言表征和每个音频表征之间的时间延迟，获得音频序列的时间对齐信息。6.根据任何前述权利要求所述的方法，训练机器学习模型包括：使用无监督学习，基于第一个训练数据集预训练机器学习模型，学习输入序列的组合音频
‑
语言表征；向预训练机器学习模型添加一个任务专用网络层，然后使用包括任务专用训练数据的第二个训练数据集执行任务专用训练，所述任务专用训练数据与具体健康监测或诊断任务相关。7.如权利要求6所述方法，其特征在于，执行任务专用训练包括：共同训练预训练机器学习模型和任务专用层，以将输入序列映射至与健康问题相关的目标输出。
8.如任何前述权利要求所述的方法，其特征在于，健康问题与一种或多种认知性或神经退行性疾病、运动障碍、情感障碍、神经行为问题、颅脑损伤或卒中相关。9.如任何前述权利要求所述的方法，其特征在于，语言表征分别编码语音数据的一个字符或音位。10.如何前述任何权利要求所述的方法，其特征在于，音频表征包括韵律表征，所述韵律表征分别编码一个语音数据段的非语言内容。11.如权利要求10所述的方法，其特征在于，获得韵律表征包括将音频数据段输入经训练的韵律编码器，以将语音数据段映射至韵律表征，所述韵律表征编码语音数据段的非语言...

【专利技术属性】
技术研发人员：杰克，
申请(专利权)人：诺沃斯有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人