利用深度学习的基于语音的创伤筛查装置及方法制造方法及图纸

技术编号:33434807 阅读:10 留言:0更新日期:2022-05-19 00:24
本发明专利技术涉及利用深度学习的基于语音的创伤筛查装置及方法。根据本发明专利技术一实施例,利用深度学习的基于语音的筛查装置及方法能够通过以非接触式而不受空间或情景制约地获得的语音来筛查创伤。语音来筛查创伤。语音来筛查创伤。

【技术实现步骤摘要】
利用深度学习的基于语音的创伤筛查装置及方法


[0001]本专利技术涉及一种利用深度学习的基于语音的创伤筛查装置及方法,更详细而言,涉及一种对语音数据进行深度学习而识别情绪并推测创伤可能性的利用深度学习的基于语音的创伤筛查装置及方法。

技术介绍

[0002]今天,现代人面临着从学习、就业等日常事件到交通事故、犯罪等严重事件的各种各样的压力。用医学术语解释,创伤被称为创伤后应激障碍(PTSD),意指由外部外伤事件导致的精神伤害。经历过创伤的人很难调节和稳定情绪,自发性恢复率在创伤发生后一年内高达60%以上,但此后急剧下降。因此,在经历创伤后1年内及早治疗对于从创伤后遗症中恢复非常重要。为了及早治疗,到医院就诊对创伤的诊断是必不可少的,但由于对精神疾病的社会偏见而延误治疗或对创伤认识不足而导致诊断及治疗失败的情形比比皆是。
[0003]近年来,深度学习已被用于将工程技术与医学领域相结合,以帮助医生进行早期诊断。尤其是,在语音中包含对掌握患者情绪非常有效的情绪和意图,可以在自然环境中以非接触方式获得却不会使患者感到排斥感,正在被广泛使用。而且,虽然进行了诸如年龄分类、情绪识别等利用语音的大量研究,但尚未进行利用语音分析的创伤筛查研究。
[0004]本专利技术的
技术介绍
在韩国授权专利第10

189765号中公布。

技术实现思路

[0005]技术问题
[0006]本专利技术提供一种利用深度学习的基于语音的创伤筛查装置及方法,利用相比影像可以在相对没有排斥感的情况下以非接触式获得的语音来筛查创伤。
[0007]本专利技术提供一种将语音数据变换成图像数据来筛查创伤的利用深度学习的基于语音的创伤筛查装置及方法。
[0008]本专利技术提供一种利用深度学习的基于语音的创伤筛查装置及方法,在通过深度学习而识别语音的情绪后,通过后处理来提高识别的准确度。
[0009]本专利技术提供一种利用深度学习的基于语音的创伤筛查装置及方法,无需特定情景或空间,只需一个语音便可以便利地识别情绪,有助于创伤诊断。
[0010]技术方案
[0011]根据本专利技术一个方面,提供一种利用深度学习的基于语音的创伤筛查装置。
[0012]根据本专利技术一实施例的利用深度学习的基于语音的创伤筛查装置可以包括:输入部,所述输入部获得语音数据;预处理部,所述预处理部编辑语音数据;变换部,所述变换部将所编辑的语音数据变换成图像数据;深度学习部,所述深度学习部利用图像数据识别情绪;以及判断部,所述判断部对深度学习部的结果值进行后处理。
[0013]根据本专利技术另一方面,提供一种利用深度学习的基于语音的创伤筛查方法及记录有运行该方法的计算机程序的计算机可读记录介质。
[0014]根据本专利技术一实施例的利用深度学习的基于语音的创伤筛查方法及存储了运行该方法的计算机程序的记录介质可以包括:获得语音数据的步骤;对语音数据进行预处理的步骤;将预处理的语音数据变换成图像数据的步骤;对图像数据进行深度学习的步骤;以及对深度学习的结果值进行后处理的步骤。
[0015]通过以下附图、权利要求书及专利技术的详细说明,前述内容之外的其他方面、特征、优点将会明确。
[0016]有益效果
[0017]根据本专利技术一实施例,利用深度学习的基于语音的筛查装置及方法能够通过以非接触式而不受空间或情景制约地获得的语音来筛查创伤。
[0018]根据本专利技术一实施例,可以将语音数据变换成图像数据,通过深度学习来识别情绪,进行后处理而提高创伤筛查的准确度。
附图说明
[0019]图1是根据一实施例的利用深度学习的基于语音的创伤筛查装置的框图。
[0020]图2是用于说明根据一实施例的将语音数据变换成图像数据的方法的图。
[0021]图3是示出根据一实施例的图像数据的示例的图。
[0022]图4是示出根据一实施例的深度学习模型的示例的图。
[0023]图5是用于说明根据一实施例的基于窗大小的深度学习模型的结果值的图。
[0024]图6是用于说明根据一实施例的利用深度学习的基于语音的创伤筛查方法的图。
[0025]图7是根据一实施例的利用深度学习的基于语音的创伤筛查方法的流程图。
[0026]图8是根据一实施例的装置的框图。
[0027]附图标记
[0028]10:利用深度学习的基于语音的创伤筛查装置
[0029]100:输入部
[0030]200:预处理部
[0031]300:变换部
[0032]400:深度学习部
[0033]500:判断部
具体实施方式
[0034]本专利技术可以加以多样的变更,可以拥有多个实施例,在附图中示例性地示出特定实施例并通过详细说明对其进行详细说明。但是,这并非要把本专利技术限定于特定的实施形态,应理解为包括本专利技术的思想及技术范围内包含的所有变更、等价物以及替代物。在说明本专利技术方面,当判断认为对相关公知技术的具体说明可能不必要地混淆本专利技术要旨时,省略该详细说明。另外,只要未另外提及,本说明书及权利要求项中使用的单数表述一般应解释为意指“一个以上”。
[0035]下面参照附图,详细说明本专利技术优选实施例,在参照附图进行说明方面,相同或对应的构成要素赋予相同附图标记并省略对其的重复说明。
[0036]图1至图5是用于说明根据本专利技术一实施例的利用深度学习的基于语音的创伤筛
connected layer)。例如,深度学习部400将288*432*3大小的声谱图图像数据用作输入值。深度学习部400可以在2个3*3卷积层(Conv

layer,convolutional layer)之后执行内核大小为2*2的最大池化层(Max pooling Layer)。然后,深度学习部400通过全连接层(Fully connected layer)将创伤筛查值输出为作为二元分类的0或1的值。即,深度学习部400通过二元分类,输出有创伤几率高的情形或无创伤几率高的情形。
[0052]判断部500对深度学习部400的结果进行后处理而提高准确度。判断部500在深度学习部400的结果恒定地保持既定时间时,筛查创伤与否,提高最终结果的可靠性。例如,判断部500可以将窗大小(window size)预先设置为2

10。如果深度学习部400的结果按照设置的窗大小而保持为0或1,则判断部500最终筛查有无创伤。
[0053]图5是用于说明根据一实施例的基于窗大小的深度学习模型的结果值的图。
[0054]如果参照图5,判断部500将窗大小设置为4~8,只提取值按照设置的窗大小保持不变的情形的结果值。如此一来,可以确认判断部500在语音数据中识别的情绪的准确度为100%。可以确认,窗大小1是判断部500不进行后处理的情形,准确度为99.03,而当窗大小选定为4~8,判断部500进行后处理时,准确度为100%。如果详细说明,利用深度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种装置,所述装置是利用深度学习的基于语音的创伤筛查装置,包括:存储器,所述存储器存储至少一个程序;及处理器,所述处理器运行所述至少一个程序,从而执行运算;其中,所述处理器获得语音数据,对所述语音数据进行预处理,将所述预处理的语音数据变换成图像数据,将所述图像数据输入深度学习模型,作为所述深度学习模型的输出值而获得创伤结果值。2.根据权利要求1所述的装置,其中,所述处理器按既定时间单位进行移动以使所述语音数据成为具有既定长度的数据,从而对所述语音数据进行预处理。3.根据权利...

【专利技术属性】
技术研发人员:卢俞宪
申请(专利权)人:伊莫克有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1