用于处理音频信号的方法、用于控制设备的方法及其系统技术方案

技术编号：36940138 阅读：32 留言：0更新日期：2023-03-22 19:01

本发明专利技术提供用于处理音频信号的方法和设备。在此，在接收到的音频信号中识别音频信号中的操作人员的语音输入的开始。从识别出的语音输入的开始起基本上实时地持续分析音频信号以用于提供语音分析结果。根据语音分析结果动态地规定语音输入的结束。最后，基于在识别出的开始与所规定的结束之间的音频信号来提供语音数据流。语音数据流随后可以被引向进一步分析，例如以便辨识一个或多个语音指令。例如以便辨识一个或多个语音指令。例如以便辨识一个或多个语音指令。

全部详细技术资料下载

【技术实现步骤摘要】
用于处理音频信号的方法、用于控制设备的方法及其系统

[0001]本专利技术涉及一种用于处理包含操作人员的语音输入的音频信号的方法、一种基于此的用于控制设备的方法以及一种对应的系统。尤其地，本专利技术在此涉及用于控制医学设备的方法以及具有医学设备的对应的医学系统。

技术介绍

[0002]医学设备通常用于治疗和/或检查患者。为了检查患者，例如将医学成像模态用作医学设备。这种成像模态例如可以包括磁共振设备、计算机断层扫描设备、PET设备(正电子发射断层扫描设备)等。此外，为了治疗患者，使用介入和/或治疗设备、例如放疗或放射治疗设备、用于执行尤其微创手术的设备等。在此，借助于医学设备治疗和/或检查患者通常由操作人员支持，例如由护理人员、技术人员、X射线助理员工或医生支持。
[0003]在借助于这种医学设备执行患者的治疗和/或检查之前和期间，通常应对医学设备进行不同的设定，例如输入患者数据、设定不同的设备参数等。所述步骤通常由操作人员执行，其中进行医学设备的设定通常经由在设备处提供的物理用户界面来实现，操作人员可以在所述用户界面中进行输入。
[0004]为了经济地运行这种医学设备，期望顺畅的工作或方法流程。尤其应尽可能简单地设计设定的进行。在所述方面，DE 10 2006 045 719 B4描述了具有语音输入设备的医学系统，其中可以借助于语音控制来激活和停用所述系统的特定功能。在此，借助于语音分析模块处理借助于语音输入设备检测的音频信号，以便求取操作人员的一个或多个语音指令。
[0005]在复杂的系统...

【技术保护点】

【技术特征摘要】
1.一种用于处理音频信号(E1)的计算机实现的方法，所述方法具有如下步骤：
‑
接收(S20)所述音频信号(E1)；
‑
在所述音频信号(E1)中识别(S40
‑
A)操作人员的语音输入的开始(BE)；
‑
从识别出的所述语音输入的开始(BE)起基本上实时地分析(S40
‑
B)所述音频信号(E1)，以用于提供语音分析结果；
‑
基于所述语音分析结果规定(S40
‑
D，S40
‑
D')所述语音输入的结束(EN)；以及
‑
基于在识别出的开始(BE)与所规定的结束(EN)之间的所述音频信号(E1)来提供(S40
‑
E)语音数据流(E2)。2.根据权利要求1所述的方法，所述方法还具有：
‑
基于所述语音分析结果调整(S40
‑
C)自适应时间段(AZS)；其中规定(S40
‑
D)所述语音输入的结束(EN)的步骤包括：
‑
检测(S40
‑
D
‑
0)所述音频信号(E1)不包含语音输入的时刻(T0)；
‑
如果从所检测的时刻(T0)起在所述自适应时间段(AZS)内识别出没有语音输入的新的开始(BE)，则将所述语音输入的结束(EN)规定(S40
‑
D
‑
1)到所检测的时刻(T0)。3.根据权利要求2所述的方法，所述方法还具有：
‑
重复(S40
‑
D
‑
2)检测(S40
‑
D
‑
0)的步骤，直至从所检测的时刻(T0)开始在所述自适应时间段(AZS)内识别出没有语音输入的新的开始(BE)；
‑
其中在重复(S40
‑
D
‑
2)期间持续地执行分析(S40
‑
B)的步骤，并且基于这样获得的所述语音分析结果持续地调整(S40
‑
C)所述自适应时间段。4.根据权利要求1所述的方法，所述方法还具有：
‑
基于所述语音分析结果调整(S40
‑
C')自适应时间段(AZS)；其中规定(S40
‑
D)所述语音输入的结束(EN)的步骤包括：
‑
在从识别出的所述语音输入的开始(BE)起所述自适应时间段(AZV)结束之后规定(S40
‑
D')所述语音输入的结束(EN)。5.根据权利要求2至4中任一项所述的方法，其中：
‑
分析(S40
‑
B)所述音频信号(E1)的步骤包括求取(S40
‑
B
‑
0)所述语音输入从识别出的开始(BE)起迄今的持续时间(D)；
‑
所述语音分析结果(E3)包括所述语音输入的迄今的持续时间(D)，以及
‑
在调整(S40
‑
C，S40
‑
C')的步骤中，根据所述迄今的持续时间(D)适配所述自适应时间段(AZS)，其中所述自适应时间段(AZS)尤其适配成，使得所述自适应时间段(AZS)至少分部段地随着所述迄今的持续时间(D)增加。6.根据上述权利要求中任一项所述的方法，其中：
‑
分析(S40
‑
B)所述音频信号(E1)的步骤包括用于分割所述音频信号(E1)内的字母、单词和/或句子的标记化(S40
‑
B
‑
2)；
‑
所述语音分析结果包括相关联的标记化信息。7.根据权利要求6与权利要求2至5中任一项相结合的所述的方法，其中：
‑
所述标记化信息指示所述操作人员是否已经说完当前句子；以及在确定(S40...

【专利技术属性】
技术研发人员：泽伦，
申请(专利权)人：西门子医疗有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人