【技术实现步骤摘要】
数据处理方法、装置、设备、存储介质及程序产品
[0001]本申请涉及计算机
,具体涉及人工智能
,具体涉及一种数据处理方法、数据处理装置、计算机设备、计算机可读存储介质及计算机程序产品。
技术介绍
[0002]随着计算机技术的不断发展和应用,越来越多的场景需要用到数据处理技术,例如通过数据处理技术对语音数据进行关键词检测,用以唤醒智能设备、检测关键词出现频率等。但如何实现关键词检测是目前的研究热点。
技术实现思路
[0003]本申请提供一种数据处理方法、数据处理装置、计算机设备、计算机可读存储介质及计算机程序产品,可以实现多语种类型的关键词检测,实现关键词检测的自动化及智能化,提高关键词检测的效率。
[0004]本申请提供了一种数据处理方法,该方法包括:获取待识别语音数据,以及获取参考关键词的目标音节序列;
[0005]调用关键词检测模型对上述待识别语音数据进行处理,确定上述待识别语音数据的待检测音节序列,根据上述待检测音节序列和上述目标音节序列确定上述待识别语音数据的关键词检测结 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取待识别语音数据,以及获取参考关键词的目标音节序列;调用关键词检测模型对所述待识别语音数据进行处理,确定所述待识别语音数据的待检测音节序列,根据所述待检测音节序列和所述目标音节序列确定所述待识别语音数据的关键词检测结果;其中,所述关键词检测模型是利用训练数据集训练得到的,所述训练数据集包括一个或多个语种类别的样本语音数据;所述关键词检测模型可对所述一个或多个语种类别中任一个语种类别的语音数据进行关键词检测。2.根据权利要求1所述的方法,其特征在于,所述关键词检测模型包括特征提取网络、音节识别网络、关键词匹配网络;所述音节识别网络包括一个或多个识别子网络,每一个识别子网络用于对一个指定语种类别的语音数据进行音节识别,所述指定语种类别包含于所述一个或多个语种类别中;当所述音节识别网络包括多个识别子网络时,所述多个识别子网络中任意两个识别子网络的网络参数相匹配。3.根据权利要求1所述的方法,其特征在于,所述获取参考关键词的目标音节序列,包括:获取参考关键词,以及获取所述待识别语音数据的目标语种类别;获取所述参考关键词的与所述目标语种类别相匹配的音节序列,将所述参考关键词的与所述目标语种类别相匹配的音节序列确定为目标音节序列。4.根据权利要求2所述的方法,其特征在于,所述调用关键词检测模型对所述待识别语音数据进行处理,确定所述待识别语音数据的待检测音节序列,根据所述待检测音节序列和所述目标音节序列确定所述待识别语音数据的关键词检测结果,包括:调用关键词检测模型的特征提取网络对所述待识别语音数据进行处理,得到所述待识别语音数据的语音特征;调用所述关键词检测模型的音节识别网络对所述语音特征进行处理,得到所述待识别语音数据的待检测音节序列;调用所述关键词检测模型的关键词匹配网络对所述待检测音节序列和所述目标音节序列进行处理,得到所述待识别语音数据的关键词检测结果。5.根据权利要求4所述的方法,其特征在于,所述调用所述关键词检测模型的音节识别网络对所述语音特征进行处理,得到所述待识别语音数据的待检测音节序列,包括:调用所述关键词检测模型的音节识别网络对所述语音特征进行处理,根据所述语音特征确定所述待识别语音数据的目标语种类别;调用所述音节识别网络中所述目标语种类别对应的识别子网络对所述语音特征进行处理,得到所述语音特征的音节分布概率;根据所述音节分布概率确定所述待识别语音数据的待检测音节序列。6.根据权利要求4所述的方法,其特征在于,所述待检测音节序列包括一个或多个按照第一顺序排列的音节元素,所述目标音节序列包括一个或多个按照第二顺序排列的音节元素;所述调用所述关键词检测模型的关键词匹配网络对...
【专利技术属性】
技术研发人员:袁有根,吕志强,黄申,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。