【技术实现步骤摘要】
一种基于内容智能识别的音频多功能刻录方法及系统
[0001]本专利技术涉及数据处理领域,尤其涉及一种基于内容智能识别的音频多功能刻录方法及系统。
技术介绍
[0002]刻录机是一种可以进行各类数据刻录的设备,如刻录音频数据视频数据等,并且刻录机不仅可以进行各类数据的刻录还可以进行各类数据的读取。现有的刻录机在刻录音频时,按照音频目录依次存储,在进行播放时可以按照目录进行选择性播放。由于刻录机功能的单一性,在用于语言培训中场景化适应能力较弱,例如少儿语音培训中可操作性较弱。
[0003]因此,在现有技术中由于刻录机功能的单一性,导致刻录机设备场景化适应能力较弱的技术问题。
技术实现思路
[0004]本申请通过提供一种基于内容智能识别的音频多功能刻录方法及系统,解决了在现有技术中由于刻录机功能的单一性,导致刻录机设备场景化适应能力较弱的技术问题。
[0005]本申请提供一种基于内容智能识别的音频多功能刻录方法,应用于基于内容智能识别的音频多功能刻录系统,所述系统应用于音频播放设备,包括:获取待刻录 ...
【技术保护点】
【技术特征摘要】
1.一种基于内容智能识别的音频多功能刻录方法,其特征在于,应用于基于内容智能识别的音频多功能刻录系统,所述系统应用于音频播放设备,包括:获取待刻录卡片的电子扫描图片和预制刻录音频;对所述电子扫描图片进行内容特征提取,生成图像背景特征、图像物体特征和图像文字特征;根据所述图像背景特征、所述图像物体特征和所述图像文字特征进行编码,生成身份识别标识码;将所述预制刻录音频和所述身份识别标识码关联,生成音频触发映射关系;根据所述身份识别标识码和所述音频触发映射关系,构建音频触发决策模型;根据音频播放设备,获取音频刻录装置和卡片插入装置;根据所述身份识别标识码对所述待刻录卡片的预设区域进行凸起标识码加工;将所述音频触发决策模型迁移至所述卡片插入装置,将所述预制刻录音频刻录于所述音频刻录装置。2.如权利要求1所述的一种基于内容智能识别的音频多功能刻录方法,其特征在于,所述对所述电子扫描图片进行内容特征提取,生成图像背景特征、图像物体特征和图像文字特征,包括:构建内容特征提取模型,其中,所述内容特征提取模型包括背景特征分离层、物体特征分离层和文字特征分离层;将所述电子扫描图片输入所述背景特征分离层,输出所述图像背景特征;将所述电子扫描图片输入所述物体特征分离层,输出所述图像物体特征;将所述电子扫描图片输入所述文字特征分离层,输出所述图像文字特征。3.如权利要求2所述的一种基于内容智能识别的音频多功能刻录方法,其特征在于,所述构建内容特征提取模型,其中,所述内容特征提取模型包括背景特征分离层、物体特征分离层和文字特征分离层,包括:对初始图片集进行背景特征标识,生成背景特征标签数据集和背景标记图片集,基于AlexNet神经网络结构,训练所述背景特征分离层;对所述初始图片集进行物体特征标识,生成物体特征标签数据集和物体标记图片集,基于AlexNet神经网络结构,训练所述物体特征分离层;对所述初始图片集进行文字特征标识,生成文字特征标签数据集和文字标记图片集,基于AlexNet神经网络结构,训练所述文字特征分离层。4.如权利要求3所述的一种基于内容智能识别的音频多功能刻录方法,其特征在于,所述对初始图片集进行背景特征标识,生成背景特征标签数据集和背景标记图片集,基于AlexNet神经网络结构,训练所述背景特征分离层,包括:对所述初始图片集、所述背景特征标签数据集和所述背景标记图片集的多组数据赋予相同权重,生成第一样本数据集;根据所述第一样本数据集,基于AlexNet神经网络结构,训练背景特征第一分离子层;提取所述背景特征第一分离子层不满足设定输出准确率的所述第一样本数据集,记为第一损失样本数据集;判断所述第一损失样本数据集的数据量是否大于预设数据量;
若大于,提升所述第一损失样本数据集在所述第一样本数据集中的权重,基于AlexNet神经网络结构,训练背景特征第二分离子层;重复迭代,当第N损失样本数据集的数据量小于或等于所述预设数据量,根据损失样本数据集的数据量由大到小对所述背景特征第一分离子层、所述背景特征第二分离子层直...
【专利技术属性】
技术研发人员:李鹏,李传,张佳佳,孙婧妍,
申请(专利权)人:北京语艺星光文化传媒有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。