本发明专利技术公开了一种基于语音识别的术前访视系统及相应语音识别方法。本发明专利技术的系统包括:图像采集装置、声音采集装置、语音识别模块、访视问题数据库、智能语音模块以及手动录入装置,所述图像采集装置设置于系统的前侧,面向患者用于对患者的图像进行采集,所述声音采集装置为多路语音采集装置,用于采集患者的语音数据,所述访视问题数据库中按类别存储有相关疾病的预置访视问题,所述智能语音模块与所述声音采集装置相连,用于接收患者的语音数据并将患者语音数据转换成对应的回答文本,所述手动录入装置用于接收医护人员或者患者的手动信息输入。手动信息输入。手动信息输入。
【技术实现步骤摘要】
一种基于语音识别的术前访视系统及相应语音识别方法
[0001]本专利技术属于医疗器械
,具体涉及一种基于语音识别的术前访视系统及相应语音识别方法。
技术介绍
[0002]随着医学模式和护理观念的转变,手术室普遍开展了术前访视。手术室护士进行术前访视对缓解手术患者紧张情绪的作用正日益凸显出来,大部分患者希望能在手术前对手术室环境、治疗效果等进行提前了解。甚至部分患者在手术前因恐惧而失眠,导致身体进一步虚弱。患者手术前心理需求的满足,焦虑、恐惧等不良心理反应的减轻,可减少术后并发症,促进切口愈合,利于术后康复。由于我国开展术前访视工作时间不长,术前访视中存在的问题较多。
[0003]一方面,护理人员对术前访视工作的认识不足,手术室护士的传统工作就是配合完成手术治疗,容易忽视对患者的全期护理,另一方面,术前访视质量难以保证,首先因为人力不足导致开展术前访视有困难,其次,虽然手术室护士中的部分人员可能经历过多次手术,对手术过程很好地了解。但是,护士的学历水平以及医学素养与医生还是存在着很大差距,即使进行了访视,许多也只是流于形式,处于应付检查状态,访视的规范化受到限制,没有标准流程,国内值得借鉴的方法和经验相对较少,访视的质量监控体系基本上带有探索的性质,缺乏量化指标,绝大部分术前访视仅仅是基于仅有的访视制度或规范流水化完成访视,作用有限。
[0004]不少医院术前访视的对象只是选择性开展,访视的形式单一,大多口头讲解,缺乏沟通技巧,由于术前宣教是由病房护士和手术室护士分别在不同的时间完成,常常会出现宣教内容重复、不一致或缺漏现象,尤其某些问题和信息是患者真正关心的,病房护士和手术室护士却无法解答。
[0005]当前的术前访视与术前评估分离,术前评估是术前访视的第一步.是对患者术前的情况进行评估。根据术前评估提出护理诊断和护理计划,进行针对性地术前宣教和指导。但仅少量医院同时进行了术前评估和术前访视。说明术前访视的程序和方法都存在问题和缺陷,没有术前评估的术前访视存在盲目性.无法满足患者的真实需求。
技术实现思路
[0006]为解决上述问题,需要大力提升术前访视的信息化与智能化水平。术前访视的信息化推动访视内容的记录和处理由纸质向数字化过渡,有助于医务人员更方便地采集和处理数据,降低成本并提高工作效率;术前访视的智能化以提供自动化、个性化访视为目标,基于最新的人工智能技术,通过智能语音交互、智能状态评估、智能护理决策等技术手段让访视更加便捷高效。
[0007]为实现上述目的,本专利技术提供如下技术方案:
[0008]一种术前访视系统,所述系统包括:图像采集装置、声音采集装置、语音识别模块、
访视问题数据库、智能语音模块以及手动录入装置,所述图像采集装置设置于系统的前侧,面向患者用于对患者的图像进行采集,所述声音采集装置为多路语音采集装置,用于采集患者的语音数据,所述访视问题数据库中按类别存储有相关疾病的预置访视问题,所述智能语音模块与所述声音采集装置相连,用于接收患者的语音数据并将患者语音数据转换成对应的回答文本,所述手动录入装置用于接收医护人员或者患者的手动信息输入,所述语音识别模块包括用于对语音信号进行预处理的语音信号预处理模块,用于对语音进行分割的语音分割模块,用于对语音段进行长语音、中语音和短语音分类的语音分类模块,用于从长语音和中语音中进行类短语音提取的语音提取模块,用于对短语音和类短语音进行分类的短语音分类模型模块,以及能够基于短语音分类进行语音识别模型更新的语音识别模型。
[0009]优选地,所述的术前访视系统还包括问题匹配模块,所述问题匹配模块基于患者语音数据中所包含的患者问题与访视问题数据库中的问题进行匹配,进而将相应问题的回答范本呈现在所述术前访视系统的显示屏幕上。
[0010]优选地,所述的术前访视系统还包括智能语音模块,所述智能语音模块用于将文本数据转换成语音数据进行对外输出。
[0011]优选地,所述的术前访视系统还包括公网患者数据库和院内患者病历库,所述公网患者数据库中存储有各类疾病的相关患者病例信息,所述院内患者病历库中存储有本院相关疾病的患者病例及治疗方面的详细信息。
[0012]优选地,所述语音提取模块用于对短语音和类短语音进行分帧和加窗,得到短时加窗的语音信号x
l
[n],
[0013]x
l
[n]=w[n]x[n+lL],
[0014]其中,0≤n≤N
‑
1,w[n]是窗函数,N为窗长度,l为帧索引序列,L表示帧移长度。
[0015]优选地,所述语音识别模型包括情绪短语音分类子模型、短语音方言分类子模型以及语音识别总模型。
[0016]本专利技术还提供了一种用于所述的术前访视系统的语音识别方法,其特征在于,所述方法包括:
[0017]接收声音采集装置采集到的语音信号,对终端接收的语音信号进行降/去噪处理;
[0018]对处理后的语音信号按照信号的短时平均幅度以及短时平均过零率是否达到预定阈值确定语音间歇,基于语音间歇的长短是否超过设定阈值,进行信号分割,形成多个有效语音段;
[0019]基于语音段的长度对其进行分类,分为长语音、中语音和短语音三部分;
[0020]截取所述长语音、中语音中短时平均幅度高于语音整体平均幅度预定值的片段作为“类短语音”;
[0021]对于短语音和类短语音,事先构建情绪短语音子库以及方言短语音子库;
[0022]对短语音和类短语音进行特征提取,特征提取过程包括分帧、加窗、短时傅里叶列变换;
[0023]分别构建短语音情绪分类子模型、短语音方言分类子模型,对于短语音和类短语音进行情绪分类和方言分类;
[0024]构建语音识别模型并对所述语音识别模型进行训练,基于情绪分类和方言分类更
新语音识别模型的训练数据集,并且对所述语音识别模型的进行修正训练;
[0025]利用修正训练后的语音识别模型对进行语音识别。
[0026]本专利技术采用采用文字、人工智能语音交互式医疗健康机器人进行不同术前访视方式的研究,为患者围术期的护理提供理论依据。
[0027](1)针对人机交互问题,本申请的专利技术人在研究过程中注意到病人在术前访视过程中,其语音识别与普通的语音识别存在较大差异,术前访视病人极易出现情绪激动、悲痛、甚至哭泣等情绪,导致不仅影响语音识别的质量,并且还会影响术前访视质量,因此,本专利技术通过设置前置的分类模型对患者的情绪进行分类,然后可以更准确地确定患者的情绪和方言分类,并且及时通过补充训练来更新识别模型,可以大幅度提升极端情绪下的识别准确率。
[0028](2)本专利技术采用了语音+触屏+按键的多模交互方案,其中语音识别技术,采用了创新的语言识别模型和方法,即使患者发音不准、存在方言、情绪激动的情况下,依然可以保持语音高识别率。
[0029](3)借助强大的语音识别、语义理解、自然语音合成等技术,语音交互医疗健康服务机器人能够准本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于语音识别的术前访视系统,其特征在于,所述系统包括:图像采集装置、声音采集装置、语音识别模块、访视问题数据库、智能语音模块以及手动录入装置,所述图像采集装置设置于系统的前侧,面向患者用于对患者的图像进行采集,所述声音采集装置为多路语音采集装置,用于采集患者的语音数据,所述访视问题数据库中按类别存储有相关疾病的预置访视问题,所述智能语音模块与所述声音采集装置相连,用于接收患者的语音数据并将患者语音数据转换成对应的回答文本,所述手动录入装置用于接收医护人员或者患者的手动信息输入,所述语音识别模块包括用于对语音信号进行预处理的语音信号预处理模块,用于对语音进行分割的语音分割模块,用于对语音段进行长语音、中语音和短语音分类的语音分类模块,用于从长语音和中语音中进行类短语音提取的语音提取模块,用于对短语音和类短语音进行分类的短语音分类模型模块,以及能够基于短语音分类进行语音识别模型更新训练的语音识别模型。2.根据权利要求1所述的术前访视系统,其特征在于,还包括问题匹配模块,所述问题匹配模块基于患者语音数据中所包含的患者问题与访视问题数据库中的问题进行匹配,进而将相应问题的回答范本呈现在所述术前访视系统的显示屏幕上。3.根据权利要求2所述的术前访视系统,其特征在于,还包括智能语音模块,所述智能语音模块用于将文本数据转换成语音数据进行对外输出。4.根据权利要求2所述的术前访视系统,其特征在于,还包括患者数据库,所述患者数据库中存储有各类疾病的相关患者病例信息。5.根据权利要求2所述的术前访视系统,其特征在于,语音提取模块用于对短语音和类短语音进行分帧和加窗,得到短时加窗的语音信号x
l<...
【专利技术属性】
技术研发人员:范文文,
申请(专利权)人:中南大学湘雅二医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。