声纹样本采集方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：20591346 阅读：67 留言：0更新日期：2019-03-16 07:55

本发明专利技术公开了一种声纹样本采集方法、装置、计算机设备及存储介质。所述方法包括：获取声纹采集请求中包含的台词情绪标签；从预设的台词数据库中选取台词情绪标签对应的台词文本，并将台词文本发送到客户端；接收客户端返回的采集用户朗读台词文本的语音数据；对语音数据进行有效性校验，若有效性校验通过，则将语音数据转换为语音文本；对语音文本和台词文本进行文本相似度匹配；若匹配结果为匹配成功，则提取所述语音数据的声纹特征，将声纹特征、台词情绪标签和台词文本作为声纹样本，并关联保存到声纹情绪识别模型对应的样本库中。本发明专利技术的技术方案通过台词情绪标签有针对性的采集声纹情绪识别模型的声纹样本，降低采集成本，提高采集效率。

全部详细技术资料下载

【技术实现步骤摘要】
声纹样本采集方法、装置、计算机设备及存储介质
本专利技术涉及计算机
，尤其涉及一种声纹样本采集方法、装置、计算机设备及存储介质。
技术介绍
目前，随着机器智能化的不断发展，越来越多的关于情绪识别的模型和方法被分析研究，现有的情绪识别主要基于对人脸图片的表情识别。声纹(Voiceprint)是指说话人语音频谱的信息图。由于每个人的发音器官不同，所发出来的声音及其音调各不相同，声纹能够携带言语信息的声波频谱，不仅具有特定性，而且有相对稳定性的特点。当将声纹应用于情绪识别时，基于声纹的情绪识别模型需要大量的声纹样本进行模型训练和验证。常见的声纹样本采集方法主要是通过人工方式从各种录音文件中的提取声音样本及其声纹特征，并通过人工标注的方式对声音样本进行情绪标注，这种人工采集方式操作繁琐，不具有针对性，导致采集成本高，采集效率低，并且采集效果不理想。
技术实现思路
本专利技术实施例提供一种声纹样本采集方法、装置、计算机设备及存储介质，以解决目前用于情绪识别的声纹样本采集成本高，且采集效率低的问题。一种声纹样本采集方法，包括：若接收到客户端发送的声纹采集请求，则获取所述声纹采集请求中包含的台词情绪标签；按照预设的选取方式，从预设的台词数据库中选取所述台词情绪标签对应的台词文本，并将所述台词文本发送到所述客户端，以使所述客户端的采集用户按照所述台词情绪标签的要求朗读所述台词文本；接收所述客户端返回的所述采集用户朗读所述台词文本的语音数据；对所述语音数据进行有效性校验，得到有效性校验结果；若所述有效性校验结果为校验通过，则使用语音转换工具将所述语音数据转换为语音文本；对...

【技术保护点】
1.一种声纹样本采集方法，其特征在于，所述声纹样本采集方法包括：若接收到客户端发送的声纹采集请求，则获取所述声纹采集请求中包含的台词情绪标签；按照预设的选取方式，从预设的台词数据库中选取所述台词情绪标签对应的台词文本，并将所述台词文本发送到所述客户端，以使所述客户端的采集用户按照所述台词情绪标签的要求朗读所述台词文本；接收所述客户端返回的所述采集用户朗读所述台词文本的语音数据；对所述语音数据进行有效性校验，得到有效性校验结果；若所述有效性校验结果为校验通过，则使用语音转换工具将所述语音数据转换为语音文本；对所述语音文本和所述台词文本进行文本相似度匹配，得到匹配结果；若所述匹配结果为匹配成功，则提取所述语音数据的声纹特征，将所述声纹特征、所述台词情绪标签和所述台词文本作为声纹样本，并关联保存到声纹情绪识别模型对应的样本库中。

【技术特征摘要】
1.一种声纹样本采集方法，其特征在于，所述声纹样本采集方法包括：若接收到客户端发送的声纹采集请求，则获取所述声纹采集请求中包含的台词情绪标签；按照预设的选取方式，从预设的台词数据库中选取所述台词情绪标签对应的台词文本，并将所述台词文本发送到所述客户端，以使所述客户端的采集用户按照所述台词情绪标签的要求朗读所述台词文本；接收所述客户端返回的所述采集用户朗读所述台词文本的语音数据；对所述语音数据进行有效性校验，得到有效性校验结果；若所述有效性校验结果为校验通过，则使用语音转换工具将所述语音数据转换为语音文本；对所述语音文本和所述台词文本进行文本相似度匹配，得到匹配结果；若所述匹配结果为匹配成功，则提取所述语音数据的声纹特征，将所述声纹特征、所述台词情绪标签和所述台词文本作为声纹样本，并关联保存到声纹情绪识别模型对应的样本库中。2.如权利要求1所述的声纹样本采集方法，其特征在于，所述对所述语音数据进行有效性校验，得到有效性校验结果包括：获取所述语音数据的录音时长；若所述语音数据的录音时长满足所述台词文本对应的语音时长的预设范围要求，则计算所述语音数据的信号累积能量；若所述信号累积能量大于或等于预设能量阈值，则确认所述有效性校验结果为校验通过；若所述语音数据的录音时长不满足所述预设范围要求，或者所述信号累积能量小于所述预设能量阈值，则确认所述有效性校验结果为校验未通过。3.如权利要求2所述的声纹样本采集方法，其特征在于，所述计算所述语音数据的信号累积能量包括：按照预设的帧长对所述语音数据进行分帧处理，得到K个语音帧，并按照预设的采样频率对每个所述语音帧进行语音信号采样，得到每个所述语音帧中的每个采样点的语音信号采样值，其中，K为正整数；按照如下公式计算每个所述语音帧的帧能量：其中，P为每个所述语音帧的帧能量，N为每个所述语音帧中的采样点的数量，Xi为每个所述语音帧中第i个所述采样点的语音信号采样值，Xmax为每个所述语音帧的N个所述采样点的语音信号采样值中的最大值；按照如下公式计算所述语音数据的信号累积能量：其中，E为所述语音数据的信号累积能量，Pj为第j个所述语音帧的帧能量，K为所述语音帧的数量。4.如权利要求1所述的声纹样本采集方法，其特征在于，所述对所述语音文本和所述台词文本进行文本相似度匹配，得到匹配结果包括：根据预设的正则表达式，获取所述台词文本中的非文字字符；对所述台词文本中的所述非文字字符进行删除处理，得到所述台词文本对应的目标语料；采用文本字符匹配的方式，计算所述语音文本和所述目标语料之间的文本相似度；若所述文本相似度大于或者等于预设的相似度阈值，则确认所述匹配结果为匹配成功；若所述文本相似度小于所述预设的相似度阈值，则确认所述匹配结果为匹配失败。5.如权利要求4所述的声纹样本采集方法，其特征在于，所述采用文本字符匹配的方式，计算...

【专利技术属性】
技术研发人员：朱文和，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人