语音处理方法、装置、电子设备及计算机可读介质制造方法及图纸

技术编号:20627946 阅读:20 留言:0更新日期:2019-03-20 17:32
本公开涉及一种语音处理方法、装置、电子设备及计算机可读介质。该方法包括:获取语音数据与其对应的处理类型,所述语音数据包括实时语音数据和\或离线语音数据;根据处理类型将所述实时语音数据分配至对应的任务队列;将所述离线语音数据进行分割处理,生成多个分割语音数据;根据处理类型将所述多个分割语音数据分配至对应的任务队列;以及通过所述任务队列读取所述语音数据以进行语音处理。本公开涉及的语音处理方法、装置、电子设备及计算机可读介质,将实时语音服务和离线语音批量服务进行整合,能够在同一个语音平台上同时处理两类语音任务。

Speech Processing, Devices, Electronic Equipment and Computer Readable Media

The present disclosure relates to a voice processing method, device, electronic device and computer readable medium. The method includes: acquiring voice data and its corresponding processing type, the voice data includes real-time voice data and \\ or off-line voice data; assigning the real-time voice data to the corresponding task queue according to the processing type; dividing the off-line voice data into several segmented voice data; and dividing the segmented voice data into several segmented voice data according to the processing type. A corresponding task queue is allocated, and the voice data is read through the task queue for voice processing. The voice processing method, device, electronic device and computer readable medium involved in the present disclosure integrate real-time voice service with off-line voice batch service, and can simultaneously process two types of voice tasks on the same voice platform.

【技术实现步骤摘要】
语音处理方法、装置、电子设备及计算机可读介质
本公开涉及语音处理领域,具体而言,涉及一种语音处理方法、装置、电子设备及计算机可读介质。
技术介绍
语音处理(speechsignalprocessing)用以研究语音发声过程、语音信号的统计特性、语音的自动识别、机器合成以及语音感知等各种处理技术的总称。利用语音处理技术,还可以实现对语音的自动识别,发音人的自动辨识,如果与人工智能技术结合,还可以实现各种语句的自动识别以至语言的自动理解,从而实现人机语音交互应答系统,真正赋予计算机以听觉的功能。语音处理技术中包括:语音识别、语音合成、语音质检等语音分析技术正在被逐渐普及使用,但是这些技术在落地时,普遍面临两个问题:(1)垂直系统化突出,缺乏通用平台化方案。导致诸多功能被重复建设,缺少通用基础平台化设计方案。(2)实时语音数据处理与离线语音数据处理在平台建设中,被孤立设计,缺乏将实时处理和离线批处理整合的方案。因此,需要一种新的语音处理方法、装置、电子设备及计算机可读介质。在所述
技术介绍
部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
有鉴于此,本公开提供一种语音处理方法、装置、电子设备及计算机可读介质,将实时语音服务和离线语音批量服务进行整合,能够在同一个语音平台上同时处理两类语音任务。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一方面,提出一种语音处理方法,该方法包括:获取语音数据与其对应的处理类型,所述语音数据包括实时语音数据和\或离线语音数据;根据处理类型将所述实时语音数据分配至对应的任务队列;将所述离线语音数据进行分割处理,生成多个分割语音数据;根据处理类型将所述多个分割语音数据分配至对应的任务队列;以及通过所述任务队列读取所述语音数据以进行语音处理。在本公开的一种示例性实施例中,获取语音数据与其对应的处理类型前包括:获取来自多个数据源接口的语音处理请求;以及对所述语音处理请求进行授权认证,认证通过后生成所述语音数据与其对应的所述处理类型;其中,所述数据源接口包括媒体资源控制协议接口,超文本传输协议接口,以及软件开发工具接口。在本公开的一种示例性实施例中,对所述语音处理请求进行授权认证包括:通过语音处理请求中的场景码,时间码,以及哈希码对所述语音处理请求进行授权认证。在本公开的一种示例性实施例中,将所述离线语音数据进行分割处理,生成多个分割语音数据包括:确定所述离线语音数据的分割数量及分割规则;根据所述分割规则与所述分割数量对所述离线语音数据进行分割处理;以及将分割处理之后的离线语音数据进行转码处理,生成所述多个分割语音数据。在本公开的一种示例性实施例中,根据所述分割规则与所述分割数量对所述离线语音数据进行分割处理包括:通过所述离线语音数据的数据量、分割数量、文件储存路径与文件标识码生成文件描述矩阵;根据所述分割规则中的转码时长与分割时间,通过所述文件描述矩阵确定负载平衡时耗;以及基于负载平衡时耗与文件描述矩阵,对所述离线语音数据进行分割处理。在本公开的一种示例性实施例中,将分割处理之后的离线语音数据进行转码处理包括:通过分割处理之后的离线语音数据生成结果描述矩阵;以及基于所述结果描述矩阵对分割处理之后的离线语音数据进行转码处理。在本公开的一种示例性实施例中,根据处理类型将所述多个分割语音数据分配至对应的任务队列包括:根据处理类型为所述多个分割语音数据确定优先级;以及基于所述优先级将所述多个分割语音数据分配至对应的任务队列。在本公开的一种示例性实施例中,通过所述任务队列读取所述语音数据以进行语音处理前包括:将所述语音数据转换为预定的语音格式。在本公开的一种示例性实施例中,通过所述任务队列读取所述语音数据以进行语音处理包括以下至少一者:通过所述任务队列读取所述语音数据以进行语音识别;通过所述任务队列读取所述语音数据以进行语音合成;通过所述任务队列读取所述语音数据以进行语义理解;以及通过所述任务队列读取所述语音数据以进行语音质检。在本公开的一种示例性实施例中,通过所述任务队列读取所述语音数据以进行语音处理还包括:语音处理之后的实时语音数据返回到实时语音数据的来源接口端;以及语音处理之后的离线语音数据返回到所述离线语音数据的存储路径中。根据本公开的一方面,提出一种语音处理装置,该装置包括:数据模块,用于获取语音数据与其对应的处理类型,所述语音数据包括实时语音数据和\或离线语音数据;实时队列模块,用于根据处理类型将所述实时语音数据分配至对应的任务队列;离线分割模块,用于将所述离线语音数据进行分割处理,生成多个分割语音数据;离线队列模块,用于根据处理类型将所述多个分割语音数据分配至对应的任务队列;以及语音处理模块,用于通过所述任务队列读取所述语音数据以进行语音处理。根据本公开的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。根据本公开的一方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。根据本公开的语音处理方法、装置、电子设备及计算机可读介质,通过对离线语音数据进行处理,进而将离线语音数据与实时语音数据转换为同一格式的方式,能够将实时语音服务和离线语音批量服务进行整合,能够在同一个语音平台上同时处理两类语音任务。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。附图说明通过参照附图详细描述其示例实施例,本公开的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据一示例性实施例示出的一种语音处理方法及装置的系统框图。图2是根据一示例性实施例示出的一种语音处理方法的流程图。图3是根据另一示例性实施例示出的一种语音处理方法的流程图。图4是根据另一示例性实施例示出的一种语音处理方法的示意图。图5是根据一示例性实施例示出的一种语音处理装置的框图。图6是根据另一示例性实施例示出的一种语音处理装置的框图。图7是根据一示例性实施例示出的一种电子设备的框图。图8是根据一示例性实施例示出一种计算机可读存储介质示意图。具体实施方式现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。附图中所示的方框图仅仅本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,包括:获取语音数据与其对应的处理类型,所述语音数据包括实时语音数据和\或离线语音数据;根据处理类型将所述实时语音数据分配至对应的任务队列;将所述离线语音数据进行分割处理,生成多个分割语音数据;根据处理类型将所述多个分割语音数据分配至对应的任务队列;以及通过所述任务队列读取所述语音数据以进行语音处理。

【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:获取语音数据与其对应的处理类型,所述语音数据包括实时语音数据和\或离线语音数据;根据处理类型将所述实时语音数据分配至对应的任务队列;将所述离线语音数据进行分割处理,生成多个分割语音数据;根据处理类型将所述多个分割语音数据分配至对应的任务队列;以及通过所述任务队列读取所述语音数据以进行语音处理。2.如权利要求1所述的方法,其特征在于,获取语音数据与其对应的处理类型前包括:获取来自多个数据源接口的语音处理请求;以及对所述语音处理请求进行授权认证,认证通过后生成所述语音数据与其对应的所述处理类型;其中,所述数据源接口包括媒体资源控制协议接口,超文本传输协议接口,以及软件开发工具接口。3.如权利要求2所述的方法,其特征在于,对所述语音处理请求进行授权认证包括:通过语音处理请求中的场景码,时间码,以及哈希码对所述语音处理请求进行授权认证。4.如权利要求1所述的方法,其特征在于,将所述离线语音数据进行分割处理,生成多个分割语音数据包括:确定所述离线语音数据的分割数量及分割规则;根据所述分割规则与所述分割数量对所述离线语音数据进行分割处理;以及将分割处理之后的离线语音数据进行转码处理,生成所述多个分割语音数据。5.如权利要求4所述的方法,其特征在于,根据所述分割规则与所述分割数量对所述离线语音数据进行分割处理包括:通过所述离线语音数据的数据量、分割数量、文件储存...

【专利技术属性】
技术研发人员:刘岩
申请(专利权)人:泰康保险集团股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1