一种用于对医学设备(1)进行语音控制的方法,具有以下步骤:检测包含操作人员的旨在控制设备的语音输入;分析音频信号,以提供第一语音分析结果;基于第一语音分析结果识别第一语音指令;确定用于第一语音指令的验证信号,包括:分析音频信号,以提供第二语音分析结果;基于第二语音分析结果识别操作人员的第二语音指令;比较第一和第二语音指令,其中当第一语音指令与第二语音指令符合一致性标准时,验证信号才确认第一语音指令,如果根据验证信号确认第一语音指令,则基于验证信号产生用于控制医学设备的控制信号,其中控制信号适合于,根据第一语音指令控制所述医学设备;将所述控制信号输入所述医学设备中。制信号输入所述医学设备中。制信号输入所述医学设备中。
【技术实现步骤摘要】
用于对医学设备进行语音控制的方法和语音控制设备
[0001]本专利技术涉及一种用于通过处理音频信号对医学设备进行语音控制的方法,所述音频信号包含操作人员的旨在控制所述设备的语音输入。尤其,本专利技术涉及一种用于对医学设备进行防首次失败(erstfehlersicheren)的语音控制的方法。本专利技术也涉及一种具有医学设备的相应的医学系统。
技术介绍
[0002]医学设备通常用于治疗和/或检查和/或监测患者,例如成像模态如磁共振设备、计算机断层扫描设备、PET设备(正电子发射断层扫描设备)或介入和/或治疗设备,如放疗或放射治疗设备。对患者的治疗和/或检查通常由操作人员辅助。
[0003]在借助这种医学设备对患者执行治疗和/或检查之前和期间,通常对医学设备进行不同的设定,例如输入患者数据、设定不同的设备参数等。这些步骤由操作人员执行,其中对医学设备进行设定通常经由在设备上提供的物理用户接口进行,操作人员能够在所述物理接口中进行输入。
[0004]为了经济地运行这种医学设备,期望流畅的工作或方法流程。尤其,进行设定应设计得尽可能简单。对此尤其适用语音控制,其中操作人员经由自然语言信号将控制指令传送给医学设备。在这方面,DE 10 2006 045719B4描述了一种具有语音输入设备的医学系统,其中能够借助于语音控制来激活和停用所述系统的特定功能。在此,借助语音输入设备检测到的音频信号借助语音分析模块进行处理,以便确定操作人员的语音指令。
[0005]在语音控制即对借助于自然语言表述的用户意图或语音指令进行分析或识别时,优选使用人工智能算法,优选神经网络。所述人工智能算法特别好地适用于将包括大量不同的与自然语音输入对应的语音序列的高维输入空间映射到包括多个限定的控制指令的目标空间上。
[0006]此外,为了准许,多个医学设备必须至少针对所选择的工作步骤或机动符合防首次失败或功能安全性的要求,以便在医学设备越来越自动化的运行期间在任意时间都确保患者和操作人员的安全。防首次失败表示:任何一次首次失败都不会引起,医学设备在其使用寿命期间的使用会变得不安全。
[0007]特别安全攸关的控制指令例如涉及在图像数据检测或放疗时触发/启动X射线辐射。安全攸关的控制指令的另一示例涉及医学设备或其组件之一,例如机器人臂在空间中的(自主)调节运动。未经授权或未经确认的辐射触发或设备运动会直接危及患者或操作人员的健康。
[0008]例如,在介入放射学的范围中的医疗程序中,其中在不同的时间点必须借助于X射线辐射生成X射线图像记录,执行介入的医生由于其无菌而不能有效地例如操作手动操作元件。要么必须中断该程序的工作流程,以便启动X射线图像记录,要么除了医生之外必须有至少一个另一操作人员在场,所述另一操作人员承担相对应的控制信号的输入。
[0009]为了在功能上安全或防首次失败地构成医学设备的硬件和/或控制软件,以处理和转换借助于任意用户接口检测到的控制指令,目前常见的是,要求由操作人员手动授权所识别的控制指令。在此要使用所谓的迪曼开关(dead man grip)作为示例。该开关/杆/手柄必须由操作人员连续地操作,以便在医学设备上执行自动调节运动。当操作人员松开迪曼开关时,调节运动自动停止。以这种方式在很大程度上避免了意外或不期望地输入控制指令。
[0010]替选于此,医学设备能够在独立的硬件,意即自身的处理器或自身的存储器上运行冗余的第二软件系统,以保护控制软件。只有当冗余的软件系统核实了初始识别出的控制指令的可信性时,才由医学设备实际执行所述控制指令,否则丢弃所述控制指令。
[0011]然而,在语音控制的领域中,目前仍然根本性缺乏已建立且可靠的方法来证实对于功能或防首次失败安全性所需的语音识别算法的质量。这尤其是由于:已知的用于语音处理的方法仍然是易出错且是非确定性的。因此,缺乏确保防首次失败安全性的(AI)语音识别算法(AI=人工智能)的训练数据集必须符合的通用标准,或用于对例如由于失真或背景噪声而改变的语音输入进行正确分类的(AI)语音识别算法的普遍有效的鲁棒性量度。这是当前研究的主题。依靠现有的安全标准的用于验证所识别的语音指令的方法也不够安全或是不可行的,因为在此也缺乏用于AI语音识别算法的经典定义的要求/标准来证实其实现。这将是对于批准或认证(AI)语音识别算法的强制性前提条件。此外,借助于如有疑问就重复首次失败的相同的、冗余的语音识别算法验证所识别的语音指令并不能保证防首次失败安全性。
[0012]因此,至今为止仅在安全攸关的应用之外使用医学设备的语音控制。
技术实现思路
[0013]本专利技术的目的是,解决该问题并且提供用于对医学设备进行语音控制的机构,所述机构允许以改进的方式即更可靠的方式从音频信号中确定操作人员的语音指令。尤其,本专利技术的目的是,提供一种借助于语音控制确保防首次失败安全性的机构。
[0014]根据本专利技术,所述目的通过根据本专利技术的实施例所述的一种用于对医学设备进行语音控制的方法、一种相对应的语音控制设备、一种包括所述语音控制设备的医学系统、一种计算机程序产品以及一种计算机可读的存储介质来实现。有利的设计方案是实施例的主题。
[0015]下面关于要求保护的方法以及要求保护的设备来描述根据本专利技术的目的的解决方案。在此提及的特征、优点或替选的实施形式同等地转用于其它要求保护的主题,并且反之亦然。换言之,实体权利要求(例如涉及语音控制设备)也能够借助结合方法描述或要求保护的特征来改进。所述方法的相应的功能性特征在此通过设备之一的相应的实体特征,例如模块或单元构成。
[0016]在第一方面中,本专利技术涉及一种用于对医学设备进行语音控制的方法。在实施方案中,所述方法构成为计算机实现的方法。该方法包括多个步骤。
[0017]一个步骤涉及检测语音信号,所述语音信号包含操作人员的涉及设备的控制的语音输入。一个步骤涉及分析音频信号,以提供第一语音分析结果。一个步骤涉及基于第一语音分析结果识别第一语音指令。一个步骤涉及确定验证信号以确认第一语音指令。
[0018]确定验证信号包括子步骤。一个子步骤涉及分析音频信号,以提供第二语音分析结果。一个子步骤涉及基于第二语音分析结果识别操作人员的第二语音指令。一个子步骤涉及比较第一语音指令和第二语音指令。当第一语音指令与第二语音指令符合一致性标准时,验证信号才确认第一语音指令。
[0019]另一方法步骤涉及基于验证信号和可能的第一语音指令生成用于控制医学设备的控制信号。如果根据验证信号已确认第一语音指令,则执行该步骤。在此,控制信号适合或构成为,根据第一语音指令控制医学设备。另一步骤涉及将控制信号输入到医学设备中。
[0020]在本专利技术的意义上,音频信号尤其能够包含声音信息。音频信号能够是模拟或数字或数字化信号。数字化信号能够基于模拟信号例如通过模数转换器产生。相应地,检测的步骤能够包括基于所接收到的音频信号提供数字化的音频信号或者将接收到的音频信号数字化。在实施方案中,音频信号的检测能够包括借助于本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种用于对医学设备(1)进行语音控制的方法,所述方法具有以下步骤:
‑
检测(S10)包含操作人员的旨在控制所述设备的音频信号(E1);
‑
为提供第一语音分析结果(SAE1)分析(S20)所述音频信号;
‑
基于所述第一语音分析结果识别(S30)所述操作人员的第一语音指令(SSB1);
‑
确定(S50)用于所述第一语音指令的验证信号(VS),包括:
‑
为提供第二语音分析结果(SAE2)分析(S51)所述音频信号;
‑
基于所述第二语音分析结果识别(S51)所述操作人员的第二语音指令(SSB2);
‑
比较(S53)所述第一语音指令和所述第二语音指令,其中当所述第一语音指令与所述第二语音指令符合一致性标准时,所述验证信号确认所述第一语音指令,
‑
如果根据所述验证信号确认了所述第一语音指令,则基于所述验证信号产生(S60)用于控制所述医学设备的控制信号(C1),其中所述控制信号适合于,根据所述第一语音指令控制所述医学设备;和
‑
将所述控制信号输入(S70)所述医学设备中。2.根据权利要求1所述的方法,其中
‑
为提供第一语音分析结果的分析(S20)包括:将第一计算机语言学算法(P1)应用于所述音频信号,所述第一计算机语言学算法(P1)包括第一训练函数,和
‑
为提供第二语音分析结果的分析(S51)包括:将第二计算机语言学算法(P2)应用于所述音频信号,所述第二计算机语言学算法(P2)包括第二训练函数,其中所述第一训练函数和所述第二训练函数彼此不同。3.根据权利要求2所述的方法,其中所述第二训练函数构成为,仅识别安全攸关的语音指令。4.根据权利要求1至3中任一项所述的方法,其中,分析所述音频信号包括标记化,以用于借助于所述第一计算机语言学算法和所述第二计算机语言学算法对在所述音频信号内的字母、词和/或句子进行分割,并且基于包括第一标记化信息的第一语音分析结果和包括第二标记化信息的第二语音分析结果来识别所述第一语音指令和所述第二语音指令。5.根据权利要求1至4中任一项所述的方法,其中分析所述音频信号包括:借助于所述第一计算机语言学算法和所述第二计算机语言学算法对所述音频信号进行语义分析,并且基于包括第一语义信息的第一语音分析结果和包括第二语义信息的第二语音分析结果来辨识所述第一语音指令和所述第二语音指令。6.根据权利要求3结合权利要求4或5所述的方法,其中所述第二训练函数构成为,根据第二标记化信息和/或所述第二语义信息,将结构上和/或词汇上明确的语音指令辨识为安全攸关的语音指令。7.根据权利要求5或6所述的方法,其中所述第二训练函数构成为,将具有至少三个音节的语音指令辨识为安全攸关的语音指令。8.根据权利要求2至7中任一项所述的方法,所述方法还包括以下步骤:
‑
将所述第一语音指令分类(S40)为多个安全类别中的一个安全类别,其中为安全攸关的语音指令提供多个安全类别中的至少...
【专利技术属性】
技术研发人员:泽伦,
申请(专利权)人:西门子医疗有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。