基于声控系统与VR的医疗语音识别构建方法及系统技术方案

技术编号:19145850 阅读:25 留言:0更新日期:2018-10-13 09:34
本发明专利技术提供了一种基于声控系统与VR的医疗语音识别构建方法及系统,包括:通过声控系统对应的语音识别基础需求,建立对应的语音词汇信息库文件列表;建立调用所述语音词汇信息库文件列表的方法;建立声控系统与语音词汇信息库文件列表的关联系统,将输入的语音信息与语音词汇信息库文件列表中的数据作匹配;通过声控系统将VR中的操作状态切换为声控系统控制、获取对应医疗系统的操作状态。本发明专利技术能够让体验者拥有更多的沉浸感,更多的代入感,更强的真实医疗环境的体验感。经过前期大量的词汇数据测试与数据库匹配系统的检测,以及语音识别程序中识别灵敏度针对不同状态灵活切换的巧妙设计,从而保证了识别系统准确性。

Construction method and system of medical speech recognition based on voice control system and VR

The invention provides a method and a system for constructing medical speech recognition based on a voice control system and a VR. The method comprises: establishing a corresponding vocabulary information library file list through the corresponding voice recognition basic requirements of the voice control system; establishing a method for calling the vocabulary information library file list; and establishing a voice control system and a vocabulary word The related system of the file list of the sink information base matches the input voice information with the data in the file list of the vocabulary information base, and the operation state of the VR is changed into the operation state of the vocal control system through the vocal control system to obtain the operation state of the corresponding medical system. The invention can make the experiencer have more immersion feeling, more substitution feeling and stronger experience feeling of real medical environment. After a large number of vocabulary data tests and database matching system detection, and the speech recognition program sensitivity for different states flexible switching ingenious design, thus ensuring the accuracy of the recognition system.

【技术实现步骤摘要】
基于声控系统与VR的医疗语音识别构建方法及系统
本专利技术涉及控制系统领域,具体地,涉及基于声控系统与VR软件的医疗操作方法及系统。
技术介绍
虚拟现实(VirtualReality,简称VR),是由美国VPL公司创建人拉尼尔(JaronLanier)在20世纪80年代初提出的。其具体内涵是:综合利用计算机图形系统和各种现实及控制等接口设备,在计算机上生成的、可交互的三维环境中提供沉浸感觉的技术。传统的语音控制系统,例如常见的IOS语音人工智能等等,在普及性上拥有碾压性的优势,并且在运行速度上,也有非常人能及的效率。系统机制的不同导致了市面上大部分的语音识别功能比较小型化,娱乐化,虽然普及,但是在识别精准度上较差、实际作用上功能较少,故而让体验者感觉并不实用,从而不在关注。市面上现有的语音识别技术中并未有明确针对医疗系统制作的VR语音操作方式。虽然已有一些例如商业楼盘演示或者商业样板房体验中包含语音操作功能,但是由于大部分的语音识别系统的人工体验性设计较差,其实并未在VR语音应用领域产生非常大的反响,使用者寥寥无几。
技术实现思路
针对现有技术中的缺陷,本专利技术的目的是提供一种基于声控系统与VR的医疗语音识别构建方法及系统。根据本专利技术提供的一种基于声控系统与VR的医疗语音识别构建方法,包括:语音词汇信息库文件列表建立步骤:通过声控系统对应的语音识别基础需求,建立对应的语音词汇信息库文件列表;调用方法建立步骤:建立调用所述语音词汇信息库文件列表的方法;关联系统建立步骤:建立声控系统与语音词汇信息库文件列表的关联系统,将输入的语音信息与语音词汇信息库文件列表中的数据作匹配;操作状态切换步骤:通过声控系统将VR中的操作状态切换为声控系统控制、获取对应医疗系统的操作状态。较佳的,所述声控系统为UnrealEngine4引擎声控系统。较佳的,所述调用方法建立步骤还包括:在建立调用所述语音词汇信息库文件列表的方法之后进行测试。较佳的,所述关联系统建立步骤中输入的语音信息通过外部语音设备输入。较佳的,还包括识别灵敏度调整步骤:根据操作情况对语音识别的灵敏度进行调整。根据本专利技术提供的一种基于声控系统与VR的医疗语音识别构建系统,包括:语音词汇信息库文件列表建立模块:通过声控系统对应的语音识别基础需求,建立对应的语音词汇信息库文件列表;调用方法建立模块:建立调用所述语音词汇信息库文件列表的方法;关联系统建立模块:建立声控系统与语音词汇信息库文件列表的关联系统,将输入的语音信息与语音词汇信息库文件列表中的数据作匹配;操作状态切换模块:通过声控系统将VR中的操作状态切换为声控系统控制、获取对应医疗系统的操作状态。较佳的,所述声控系统为UnrealEngine4引擎声控系统。较佳的,所述调用方法建立模块还包括:在建立调用所述语音词汇信息库文件列表的方法之后进行测试。较佳的,所述关联系统建立模块中输入的语音信息通过外部语音设备输入。较佳的,还包括识别灵敏度调整模块:根据操作情况对语音识别的灵敏度进行调整。与现有技术相比,本专利技术具有如下的有益效果:本专利技术能够让体验者拥有更多的沉浸感,更多的代入感,更强的真实医疗环境的体验感。经过前期大量的词汇数据测试与数据库匹配系统的检测,以及语音识别程序中识别灵敏度针对不同状态灵活切换的巧妙设计,从而保证了识别系统准确性。附图说明通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1为本专利技术的流程图。具体实施方式下面结合具体实施例对本专利技术进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本专利技术,但不以任何形式限制本专利技术。应当指出的是,对本领域的普通技术人员来说,在不脱离本专利技术构思的前提下,还可以做出若干变化和改进。这些都属于本专利技术的保护范围。如图1所示,本专利技术提供的一种基于声控系统与VR的医疗语音识别构建方法,包括:语音词汇信息库文件列表建立步骤:通过声控系统对应的语音识别基础需求,建立对应的语音词汇信息库文件列表。在本实施例中,声控系统为UnrealEngine4引擎声控系统,但本专利技术对此不做限制。调用方法建立步骤:建立调用所述语音词汇信息库文件列表的方法,此步骤的具体实现方法为:按照当前项目的语言语种需求来设计在当前VR虚拟医疗项目中需要使用的语言口令单词列表,并且在UnrealEngine4中,以此口令列表来创建一个string类型的数组变量,用来储存此语言口令列表的所有单词数据。关联系统建立步骤:建立声控系统与语音词汇信息库文件列表的关联系统,此步骤的具体实现方法为:首先,在当前项目的start状态,首先将语音识别系统的每帧检测周围声音的通知,绑定在一个自定义事件中,此事件可以用来检测当前接受到的任何声音,并且持续的将这些声音输出成与词典中匹配的string字符串。其次,遍历之前创建的string类型的数组变量,将此数组中的单词数据通过一个自定义函数,此自定义函数使用当前遍历到的单词来生成一个记录此单词的语音识别信息的识别短语结构体。此结构体也是提前制作好的,用来储存每个单词的语音识别信息。再次,当口令数组遍历完成后,将所有生成的口令识别短语结构体,生成一个口令短语结构体数组。此结构体数组,就是用来在程序start状态中绑定的每帧检测的tick事件中,判断当前识别到的任何声音,是否有与当前短语结构体一致的信息。如果一致,即可判断当前用户已经输入了某个口令短语单词成功。最后,需要在此流程制作完毕后,通过大量的不同口音的语种人员来分别测试,以确保无任何的单词单字会导致引擎识别错误,用以保证语音识别的较高准确度。输入的语音信息与语音词汇信息库文件列表中的数据,可以通过各种外部语音输入设备,例如麦克风,录音笔等等输入的语音信息。操作状态切换步骤:通过声控系统将VR中的操作状态切换为声控系统控制、获取对应医疗系统的操作状态;此步骤的具体实现方法为:因为语音识别不是在每时每刻都需要的,比如观察模型,聆听语音解说,使用工具操作等等环节,在虚拟医疗的项目初期脚本中就可以判断是否需要语音识别来帮助用户操作的。那么在这些不需要语音识别的环节下,程序会在设计时,就将这些环节中的语音识别功能关闭。此一为减少程序性能损耗,二为避免周围人与人交流的杂音影响程序的运作,让用户体验更为流畅。在操作步骤达到需要语音识别帮助操作时,例如,某VR虚拟手术的项目中,用户观察完病人的情况后,刚刚点击“开始模拟手术”UI时,瞬间打开语音识别系统,开始每帧接收周围的声音,判断用户是否已语音输入某个短语库中预设的语句。如果用户正确语音输入了第一把工具“记号笔”准备在病人的皮肤上绘制切口线条时,将“记号笔”道具,瞬间生成在用户的手中,并且瞬间关闭语音识别操作。让程序在用户绘制切口线条至完成的过程中,程序判断不受周围其他声音的影响。如果用户未正确输入语音,但是输入了另一个短语库中的语音信息,例如“手术刀”,那么程序也会将手术刀生成在用户手中,并且瞬间关闭语音识别系统,但是同时会出现UI提示,当前操作步骤的道具有误。提示客户送开操作手柄,丢弃当前手中的错误道具。当客户丢弃手中的错误道具后,立刻再瞬间打开语音识别系统,循环上一步的识别操作,直到客户语音输入正确的操作工具。特殊情况:某本文档来自技高网...

【技术保护点】
1.一种基于声控系统与VR的医疗语音识别构建方法,其特征在于,包括:语音词汇信息库文件列表建立步骤:通过声控系统对应的语音识别基础需求,建立对应的语音词汇信息库文件列表;调用方法建立步骤:建立调用所述语音词汇信息库文件列表的方法;关联系统建立步骤:建立声控系统与语音词汇信息库文件列表的关联系统,将输入的语音信息与语音词汇信息库文件列表中的数据作匹配;操作状态切换步骤:通过声控系统将VR中的操作状态切换为声控系统控制、获取对应医疗系统的操作状态。

【技术特征摘要】
1.一种基于声控系统与VR的医疗语音识别构建方法,其特征在于,包括:语音词汇信息库文件列表建立步骤:通过声控系统对应的语音识别基础需求,建立对应的语音词汇信息库文件列表;调用方法建立步骤:建立调用所述语音词汇信息库文件列表的方法;关联系统建立步骤:建立声控系统与语音词汇信息库文件列表的关联系统,将输入的语音信息与语音词汇信息库文件列表中的数据作匹配;操作状态切换步骤:通过声控系统将VR中的操作状态切换为声控系统控制、获取对应医疗系统的操作状态。2.根据权利要求1所述的基于声控系统与VR的医疗语音识别构建方法,其特征在于,所述声控系统为UnrealEngine4引擎声控系统。3.根据权利要求1所述的基于声控系统与VR的医疗语音识别构建方法,其特征在于,所述调用方法建立步骤还包括:在建立调用所述语音词汇信息库文件列表的方法之后进行测试。4.根据权利要求1所述的基于声控系统与VR的医疗语音识别构建方法,其特征在于,所述关联系统建立步骤中输入的语音信息通过外部语音设备输入。5.根据权利要求1所述的基于声控系统与VR的医疗语音识别构建方法,其特征在于,还包括识别灵敏度调整步骤:根据操作情况对语音识别的灵敏度进行调整。...

【专利技术属性】
技术研发人员:吕天予
申请(专利权)人:上海嘉奥信息科技发展有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1