一种医学扫描语音增强方法、装置、系统及存储介质制造方法及图纸

技术编号:28540470 阅读:17 留言:0更新日期:2021-05-25 17:28
本发明专利技术涉及一种医学扫描语音增强方法、装置、系统及存储介质,该医学扫描语音增强方法包括:获取第一图像、麦克风对应的空间坐标和对应的声音信号;将第一图像输入至定位模型,确定预测空间坐标,其中,定位模型为根据第一图像训练集训练得到的模型;根据预测空间坐标和麦克风对应的空间坐标,确定至少一个收音距离;根据收音距离和麦克风对应的声音信号,确定合成语音信号。本发明专利技术利用图像定位受检者的嘴部,再结合空间坐标信息,确定受检者嘴部到多个麦克风的距离,确定相应的收音距离,以收音距离有效反馈各个麦克风接收的声音信号的有效程度,实现高效准确的声音合成,避免了背景噪音的影响,充分地提高医学扫描的高效性与便捷性。

【技术实现步骤摘要】
一种医学扫描语音增强方法、装置、系统及存储介质
本专利技术涉及医学扫描领域,尤其涉及一种医学扫描语音增强方法、装置、系统及存储介质。
技术介绍
在医学影像检查中,病人和技师需要通过语音对讲机进行交流完成扫描活动,高效的语音对讲能够提升扫描速度,并优化扫描流程和扫描结果。然而,技师和病人的交流往往受到声音干扰,例如仪器的运行声音、背景噪音、对讲机回声、多人语音干扰等。具体地,在磁共振中,产生的噪音包括冷头(冷却器)运行时候噪音,梯度(梯度线圈)运行时候噪音等,这些噪音干扰了病人和技术的正常交流,导致扫描效率低下,且由于两者的交流受阻,得到的扫描图像也不甚理想。除此之外,为了增强麦克风对病人对话的收音效果,往往会在仪器中布置多个麦克风,进行收音。在此扫描过程中,声音是从病人口中发出的,然而在扫描时候病床往往会移动,需要采集的病人声音的位置一直在不断变化,导致噪音数据也在不断增加,更加大了准确采集语音信息的难度。综上,如何在医学影像检查的过程中高效采集受检者语音是亟待解决的问题。
技术实现思路
有鉴于此,有必要提供一种医学扫描语音增强方法、装置、系统及存储介质,用以解决现有技术中如何在医学影像检查的过程中高效采集受检者语音的问题。本专利技术提供一种医学扫描语音增强方法,包括:获取第一图像、至少一个麦克风对应的空间坐标和对应的声音信号;将所述第一图像输入至训练完备的定位模型,确定受检者第一感兴趣区域的预测空间坐标,其中,所述定位模型基于第一图像训练集训练得到;根据所述预测空间坐标和所述至少一个麦克风对应的空间坐标,确定至少一个收音距离;根据所述至少一个收音距离和所述至少一个麦克风对应的声音信号,确定合成语音信号。进一步地,所述根据所述至少一个收音距离和所述至少一个麦克风对应的声音信号,确定合成语音信号,具体包括:根据所述至少一个收音距离,确定对应的至少一个声音波束形成波长;根据所述至少一个声音波束形成波长,将所述至少一个麦克风对应的声音信号组合增强,确定所述合成语音信号。进一步地,所述根据所述嘴部空间坐标和所述至少一个麦克风对应的空间坐标,确定至少一个收音距离,具体包括:根据所述预测空间坐标和所述至少一个麦克风对应的空间坐标之间的坐标差,确定对应的所述至少一个收音距离。进一步地,所述根据所述至少一个收音距离和所述至少一个麦克风对应的声音信号,确定合成语音信号,具体包括:根据所述至少一个收音距离,确定对应的至少一个收音权重;根据所述至少一个收音权重,确定所述合成语音信号。进一步地,所述定位模型的训练过程包括:获取包含标注信息的第一图像训练集,所述标注信息包括受检者第一感兴趣区域的实际空间坐标;将所述第一图像训练集输入定位模型,确定对应的所述预测空间坐标;根据所述实际空间坐标和所述预测空间坐标之间的误差,完成对所述定位模型的训练,并将所述定位模型进行存储;其中,所述第一图像训练集包括多张所述第一图像,所述第一图像为包括受检者第一感兴趣区域信息的医学图像。进一步地,所述根据所述至少一个收音距离,确定对应的至少一个收音权重包括:根据所述至少一个收音距离的平方,确定对应的至少一个收音权重。进一步地,通过以下公式,确定所述合成语音信号:K=k1*w1+k2*w2+Λ+kn*wnwn=sn2其中,K为所述合成语音信号,kn为第n个麦克风对应的声音信号,n为整数,wn为第n个麦克风对应的收音权重,sn为第n个麦克风对应的收音距离的平方。本专利技术还提供一种医学扫描语音增强装置,包括:获取单元,用于获取第一图像、至少一个麦克风对应的空间坐标和对应的声音信号;处理单元,用于将所述第一图像输入至训练完备的定位模型,确定受检者第一感兴趣区域的预测空间坐标,其中,所述定位模型基于第一图像训练集训练得到;还用于根据所述预测空间坐标和所述至少一个麦克风对应的空间坐标,确定至少一个收音距离;合成单元,用于根据所述至少一个收音距离和所述至少一个麦克风对应的声音信号,确定合成语音信号。本专利技术还提供一种医学扫描语音增强系统,包括影像扫描设备、至少一个麦克风、以及如上所述的医学扫描语音增强装置,其中,所述影像扫描设备用于获取第一图像,所述至少一个麦克风用于获取至少一路的声音信号。本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,计算机该程序被处理器执行时,实现如上所述的医学扫描语音增强方法。与现有技术相比,本专利技术的有益效果包括:在医学扫描语音增强方法中,首先,获取第一图像、麦克风对应的空间坐标和麦克风对应的声音信号,以此有效结合图像、语音、空间坐标多种信息,保证后续合成语音的准确性;进而,再将第一图像输入至定位模型,确定预测空间坐标,不仅降低了第一感兴趣区域识别的复杂度,同时提高了识别第一感兴趣区域的精准度、快速度;然后,根据预测空间坐标和麦克风对应的空间坐标,确定相应的收音距离,有效反映了受检者的第一感兴趣区域与麦克风的位置关系;最后,利用多个麦克风的声音信号和对应的收音距离进行语音合成,高效确定合成语音信号,以麦克风和受检者第一感兴趣区域的位置关系,判断了声音信号的有效程度,保证了合成语音信号的准确性。综上,本专利技术利用图像定位受检者的预测空间坐标,再结合空间坐标信息,确定受检者的第一感兴趣区域到多个麦克风的距离,确定相应的收音距离,以收音距离有效反馈各个麦克风接收的声音信号的有效程度,进而实现高效准确的声音合成,避免了背景噪音的影响,准确识别受检者发出的语音,减少了扫描过程中技师与受检者之间的交流障碍,充分地提高了医学扫描的高效性与便捷性。附图说明图1为本专利技术实施例提供的一种医学扫描语音增强方法的流程示意图;图2为本专利技术实施例提供的一种确定合成语音信号的流程示意图一;图3为本专利技术实施例提供的一种确定合成语音信号的流程示意图二;图4为本专利技术实施例提供的定位模型训练方法的流程示意图;图5为本专利技术提供实施例的定位模型的结构示意图;图6为本专利技术实施例提供的医学扫描语音增强装置的结构示意图;图7为本专利技术实施例提供的医学扫描语音增强系统的结构示意图。具体实施方式下面结合附图来具体描述本专利技术的优选实施例,其中,附图构成本申请一部分,并与本专利技术的实施例一起用于阐释本专利技术的原理,并非用于限定本专利技术的范围。本专利技术实施例提供了一种医学扫描语音增强方法,结合图1来看,图1为本专利技术实施例提供的一种医学扫描语音增强方法的流程示意图,上述提供的医学扫描语音增强方法包括步骤S101至步骤S104,其中:在步骤S101中,获取第一图像、至少一个麦克风对应的空间坐标和对应的声音信号;在步骤S102中,将第一图像输入至训练完备的定位模型,确定受检者第一感兴趣区域的预测空间坐标,其中,定位模型基于第一图像训练集训练得到;在步骤S103中,根据预测本文档来自技高网...

【技术保护点】
1.一种医学扫描语音增强方法,其特征在于,包括:/n获取第一图像、至少一个麦克风对应的空间坐标和对应的声音信号;/n将所述第一图像输入至训练完备的定位模型,确定受检者第一感兴趣区域的预测空间坐标,其中,所述定位模型基于第一图像训练集训练得到;/n根据所述预测空间坐标和所述至少一个麦克风对应的空间坐标,确定至少一个收音距离;/n根据所述至少一个收音距离和所述至少一个麦克风对应的声音信号,确定合成语音信号。/n

【技术特征摘要】
1.一种医学扫描语音增强方法,其特征在于,包括:
获取第一图像、至少一个麦克风对应的空间坐标和对应的声音信号;
将所述第一图像输入至训练完备的定位模型,确定受检者第一感兴趣区域的预测空间坐标,其中,所述定位模型基于第一图像训练集训练得到;
根据所述预测空间坐标和所述至少一个麦克风对应的空间坐标,确定至少一个收音距离;
根据所述至少一个收音距离和所述至少一个麦克风对应的声音信号,确定合成语音信号。


2.根据权利要求1所述的医学扫描语音增强方法,其特征在于,所述根据所述至少一个收音距离和所述至少一个麦克风对应的声音信号,确定合成语音信号,具体包括:
根据所述至少一个收音距离,确定对应的至少一个声音波束形成波长;
根据所述至少一个声音波束形成波长,将所述至少一个麦克风对应的声音信号组合增强,确定所述合成语音信号。


3.根据权利要求1所述的医学扫描语音增强方法,其特征在于,所述根据所述嘴部空间坐标和所述至少一个麦克风对应的空间坐标,确定至少一个收音距离,具体包括:
根据所述预测空间坐标和所述至少一个麦克风对应的空间坐标之间的坐标差,确定对应的所述至少一个收音距离。


4.根据权利要求1所述的医学扫描语音增强方法,其特征在于,所述根据所述至少一个收音距离和所述至少一个麦克风对应的声音信号,确定合成语音信号,具体包括:
根据所述至少一个收音距离,确定对应的至少一个收音权重;
根据所述至少一个收音权重,确定所述合成语音信号。


5.根据权利要求1所述的医学扫描语音增强方法,其特征在于,所述定位模型的训练过程包括:
获取包含标注信息的第一图像训练集,所述标注信息包括受检者第一感兴趣区域的实际空间坐标;
将所述第一图像训练集输入定位模型,确定对应的所述预测空间坐标;
根据所述实...

【专利技术属性】
技术研发人员:史宇航
申请(专利权)人:上海联影医疗科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1