语音处理方法、装置及系统制造方法及图纸

技术编号:23988032 阅读:15 留言:0更新日期:2020-04-29 14:32
本发明专利技术实施例提供一种语音处理方法、装置及系统。本发明专利技术实施例通过获取待处理语音信息,从多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,将待处理语音信息发送给目标语音服务平台,以便目标语音服务平台对待处理语音信息进行识别,得到第一识别结果,根据目标语音服务平台返回的第一识别结果生成医学报告,通过从多个通用型语音服务平台中选择处理能力最大的平台进行智能调度,使得待处理语音信息能够及时得到处理,避免需要排队等待的情况,提高了处理效率。

Speech processing methods, devices and systems

【技术实现步骤摘要】
语音处理方法、装置及系统
本专利技术涉及数据处理
,尤其涉及一种语音处理方法、装置及系统。
技术介绍
互联网+医疗的时代已经到来。利用互联网+医疗技术,将一系列医疗手段放于互联网上,使得大城市的大医院的专家能够为来自小城市或偏远地区的患者看病写报告,提升欠发达地区的医疗水平和效率,有效地缓解医疗资源分布不均衡的问题。图1是相关技术中语音处理系统的结构图。如图1所示,医生专家通过手机等移动终端将有关医疗诊断的语音发送到诊断平台,诊断平台将该语音发送到购买的通用型语音服务平台,通用型语音服务平台将语音转换为文字后返回给诊断平台,诊断平台根据返回的文字内容生成医学报告。这种方式中,当通用型语音服务平台的业务吞吐量比较大时,会出现请求需要排队等待处理的情况,处理效率较低。
技术实现思路
为克服相关技术中存在的问题,本专利技术提供了一种语音处理方法、装置及系统,提高处理效率。根据本专利技术实施例的第一方面,提供一种语音处理方法,应用于语音交互调度平台,所述语音交互调度平台与多个通用型语音服务平台相连;所述方法包括:获取待处理语音信息;从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台;所述通用型语音服务平台用于对语音进行通用识别;将所述待处理语音信息发送给所述目标语音服务平台,以便所述目标语音服务平台对所述待处理语音信息进行识别,得到第一识别结果;根据所述目标语音服务平台返回的所述第一识别结果生成医学报告。根据本专利技术实施例的第二方面,提供一种语音处理装置,应用于语音交互调度平台,所述语音交互调度平台与多个通用型语音服务平台相连;所述装置包括:获取模块,用于获取待处理语音信息;确定模块,用于从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台;所述通用型语音服务平台用于对语音进行通用识别;识别模块,用于将所述待处理语音信息发送给所述目标语音服务平台,以便所述目标语音服务平台对所述待处理语音信息进行识别,得到第一识别结果;生成模块,用于根据所述目标语音服务平台返回的所述第一识别结果生成医学报告。根据本专利技术实施例的第三方面,提供一种语音处理系统,包括诊断平台、语音交互调度平台以及多个通用型语音服务平台;所述诊断平台,用于接收客户端发送的待处理语音信息,并将所述待处理语音信息发送给所述语音交互调度平台;所述语音交互调度平台,用于获取待处理语音信息,从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,所述通用型语音服务平台用于对语音进行通用识别,将所述待处理语音信息发送给所述目标语音服务平台,根据所述目标语音服务平台返回的所述第一识别结果生成医学报告,并将生成的医学报告返回给所述诊断平台;所述通用型语音服务平台,用于接收所述语音交互调度平台发送的所述待处理语音信息,对所述待处理语音信息进行识别,得到第一识别结果并发送给所述语音交互调度平台。本专利技术实施例提供的技术方案可以包括以下有益效果:本专利技术实施例,通过获取待处理语音信息,从多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,将待处理语音信息发送给目标语音服务平台,以便目标语音服务平台对待处理语音信息进行识别,得到第一识别结果,根据目标语音服务平台返回的第一识别结果生成医学报告,通过从多个通用型语音服务平台中选择处理能力最大的平台进行智能调度,使得待处理语音信息能够及时得到处理,避免需要排队等待的情况,提高了处理效率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书一起用于解释本说明书的原理。图1是相关技术中语音处理系统的结构图。图2是本专利技术实施例提供的语音处理系统的一个示例图。图3是本专利技术实施例提供的语音处理方法的流程示例图。图4是本专利技术实施例提供的语音处理系统的另一个示例图。图5是本专利技术实施例提供的语音处理装置的功能方块图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术实施例的一些方面相一致的装置和方法的例子。在本专利技术实施例使用的术语是仅仅出于描述特定本专利技术实施例的目的,而非旨在限制本专利技术实施例。在本专利技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本专利技术实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本专利技术实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。诊断平台移动端的出现,解决了一些专家总要面临出差,不能在个人计算机PC机前工作的问题。同时,伴随着语音识别技术的发展,可以将医生的语音转化成文字填写在患者的报告中,以解决移动端文字输入速度落后于PC端键盘输入的劣势,又能提升医生的诊疗效率。如图1所示,相关技术中,每个诊断平台的提供方通常只购买一个通用型语音服务平台的服务,因此,连接到该诊断平台的移动终端发出的语音信息只能通过一个通用型语音服务平台进行识别。然而,提供通用型语音服务的服务提供商不止一个,不同的通用型语音服务提供商提供不同的通用型语音服务平台,这些通用型语音服务平台都能够提供通用语音识别服务。相关技术中,诊断平台使用通用型语音服务平台提供的调用方式进行接口调用,将语音发送给通用型语音服务平台进行处理,并通过用轮询或回调的方式从通用型语音服务平台获取语音识别结果。其中,回调是指语音处理结束后,语音服务平台调用诊断平台之前在请求时提供的回调地址将语音识别结果返回给诊断平台。这种处理方式的弊端是针对多实例的异步请求,容易同时将结果返回,造成雪崩的情况发生,加重诊断平台的负担,而且此种方式还容易造成请求超时。其中,轮询是指用户端(指诊断平台)每隔一段时间向语音服务平台请求语音处理是否完成,若完成即返回语音识别结果,若没完成则用户端隔一段时间再继续请求。该种方式会浪费诊断平台的网络资源。相关技术中,各通用型语音服务平台都只能对语音进行通用识别。这里,通用识别是指对语音按照通常的语义进行识别。但是,在医学方面,医生的诊断中通常会使用大量的医学专用术语,对于含有这些专用术语的语音进行通用识别,通常会导致识别结果的错误,导致本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,应用于语音交互调度平台,所述语音交互调度平台与多个通用型语音服务平台相连;所述方法包括:/n获取待处理语音信息;/n从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台;所述通用型语音服务平台用于对语音进行通用识别;/n将所述待处理语音信息发送给所述目标语音服务平台,以便所述目标语音服务平台对所述待处理语音信息进行识别,得到第一识别结果;/n根据所述目标语音服务平台返回的所述第一识别结果生成医学报告。/n

【技术特征摘要】
1.一种语音处理方法,其特征在于,应用于语音交互调度平台,所述语音交互调度平台与多个通用型语音服务平台相连;所述方法包括:
获取待处理语音信息;
从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台;所述通用型语音服务平台用于对语音进行通用识别;
将所述待处理语音信息发送给所述目标语音服务平台,以便所述目标语音服务平台对所述待处理语音信息进行识别,得到第一识别结果;
根据所述目标语音服务平台返回的所述第一识别结果生成医学报告。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述待处理语音信息发送给专业语音服务平台,以便所述专业语音服务平台对所述待处理语音信息进行专业识别,得到第二识别结果;
根据所述第一识别结果生成医学报告,包括:
根据所述第一识别结果和所述专业语音服务平台返回的所述第二识别结果生成医学报告。


3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述第一识别结果中的待校正词语,所述待校正词语为不通顺词语或存在歧义的词语;
根据所述待校正词语在所述第一识别结果中的位置,从所述待处理语音信息中截取相应的语音片段;
将所述语音片段发送给专业语音服务平台,以便所述专业语音服务平台对所述语音片段进行专业识别,得到第三识别结果;
根据所述第一识别结果生成医学报告,包括:
根据所述第一识别结果和所述专业语音服务平台返回的所述第三识别结果生成医学报告。


4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述待处理语音信息的时长和所述目标语音服务平台的当前处理速度,确定处理时长;
从发送所述待处理语音信息给所述目标语音服务平台的时刻开始计时,当计时时长达到所述处理时长时,向所述目标语音服务平台请求返回所述医学报告。


5.根据权利要求1所述的方法,其特征在于,从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,包括:
分别从所述多个通用型语音服务平台中读取处理能力值;
将读取的处理能力值中的最大值对应的通用型语音服务平台确定为目标语音服务平台。


6.根据权利要求1所述的方法,其特征在于,从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,包括:
从当前的处理速度趋势图中获取所述多个通用型语音服务平台中各个通用型语音服务平台的处理速度;
将获取的处理速度中的最大值对应的通用型语音服务平台确定为目标语音服务平台。


7.根据权利要求2所述的方法,其特征在于,所述第二识别结果包括专业词语和专业词语在所述待处理语音信息中所处的第一位置;
根据所述第一识别结果和所...

【专利技术属性】
技术研发人员:何兴洋
申请(专利权)人:沈阳先进医疗设备技术孵化中心有限公司
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1