语音文件的标注方法技术

技术编号：39592108 阅读：9 留言：0更新日期：2023-12-03 19:46

本申请提供一种语音文件的标注方法

全部详细技术资料下载

【技术实现步骤摘要】
语音文件的标注方法、装置、服务器及存储介质

[0001]本申请涉及语音处理
，尤其涉及一种语音文件的标注方法
、
装置
、
服务器及存储介质
。

技术介绍

[0002]随着智能手机和其他便携式设备的普及，人们对于语音交互的需求逐渐增加，语音识别技术能够满足人们在移动设备上进行快速输入和操作的需求
。
语音识别依赖于标注数据进行模型训练，并通过对比标注结果进行评估和改进
。
因此，对语音文件进行标注尤为重要
。
[0003]现有技术中，主要标注人员通过抽帧的方式，获取目标帧的音频和字幕信息，根据字幕信息对音频进行标注
。
[0004]然而，现有技术这种方法会增加标注的工作量，从而增加标注成本
。

技术实现思路

[0005]本申请提供一种语音文件的标注方法
、
装置
、
服务器及存储介质，用以解决标注工作量大和标注成本高的技术问题
。
[0006]第一方面，本申请提供一种语音文件的标注方法，应用于服务器，包括：
[0007]采集待标注的语音文件
。
[0008]对所述语音文件进行格式转换处理，得到目标格式的语音文件
。
[0009]将所述目标格式的语音文件转换为文本数据
。
[0010]对所述文本数据进行标注，得到所述语音文件的标注结果
。
[0011]可选地，如上所述的...

【技术保护点】

【技术特征摘要】
1.
一种语音文件的标注方法，其特征在于，应用于服务器，包括：采集待标注的语音文件；对所述语音文件进行格式转换处理，得到目标格式的语音文件；将所述目标格式的语音文件转换为文本数据；对所述文本数据进行标注，得到所述语音文件的标注结果
。2.
根据权利要求1所述的方法，其特征在于，所述对所述语音文件进行格式转换处理，得到目标格式的语音文件，包括：对所述语音文件进行解码，得到无损格式的语音文件；对所述无损格式的语音文件添加隐含参数，得到带有隐藏信息的语音文件；对所述带有隐藏信息的语音文件进行目标格式的编码，得到所述目标格式的语音文件
。3.
根据权利要求1所述的方法，其特征在于，所述将所述目标格式的语音文件转换为文本数据，包括：根据预设时长条件，对所述目标格式的语音文件进行筛选，得到第一语音文件；根据损失函数，在所述第一语音文件中删除包含噪音的所述语音文件，得到第二语音文件；对所述第二语音文件进行文本识别，得到所述文本数据
。4.
根据权利要求3所述的方法，其特征在于，所述损失函数如下：
L
＝
‑
w
×
y
×
log(y
′
)
‑
(1
‑
w)
×
(1
‑
y)
×
log(1
‑
y
′
)
‑
w
×
log(y
′
)+r
式中，
L
表示损失值，
y
表示所述第一语音文件的真实标签，
y
′
表示预测概率，
w
表示权重，
r
表示正则化项
。5.
根据权利要求1至4任一项所述的方法，其特征在于，所述对所述文本数据进行标注，得到所述语...

【专利技术属性】
技术研发人员：何鑫，王涛，梁昊譞，
申请(专利权)人：中国联合网络通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人