一种语音识别模型的有声图书的数据预处理方法及系统技术方案

技术编号：46587100 阅读：2 留言：0更新日期：2025-10-10 21:23

本发明专利技术提供一种语音识别模型的有声图书的数据预处理方法及系统，属于语音识别技术领域，具体包括：基于上传用户在不同的专辑内部的质量风险图书的分布数据以及历史浏览数据，确定上传用户中的图书质量可靠用户，确定图像质量可靠用户的上传有声图书所对应的专辑的质量风险图书的分布数据，并结合上传有声图书对应的专辑的相似专辑中的历史质检数据，确定上传有声图书在上架之前，利用语音识别模型的预先的质检处理方法，提升了有声图书的图书质量。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于语音识别，尤其涉及一种语音识别模型的有声图书的数据预处理方法及系统。

技术介绍

1、有声图书以其便利性受到了越来越多人的青睐，但是与此同时，有声图书的质量层次不齐，对用户的使用体验造成了不小的影响。

2、现有的专利技术专利往往聚集于有声图书在制作过程中的质量控制，例如专利技术专利申请cn202410203822.3《一种多情感有声书的制作方法、系统、设备及存储介质》、cn202310894064.x《基于多模态大语言模型的有声书自动生成方法》等，但是上述技术方案均未考虑如何进行对未上架的有声图书的预先的质检处理策略的确定，具体的有声图书所处的专辑的差异，其包含不良信息等质量风险因素存在一定程度的差异，若不能根据有声图书所处的专辑的差异，生成差异化的预先质检方法，则会用户的使用体验造成影响。

3、为解决上述技术问题，本申请提供一种语音识别模型的有声图书的数据预处理方法及系统。

技术实现思路

1、为实现本专利技术目的，本专利技术采用如下技术方案：

<...

【技术保护点】

1.一种语音识别模型的有声图书的数据预处理方法，其特征在于，具体包括：

2.如权利要求1所述的语音识别模型的有声图书的数据预处理方法，其特征在于，所述有声图书的上架需求数据包括所述有声书平台在不同日期中待上架处理的有声图书的数量。

3.如权利要求1所述的语音识别模型的有声图书的数据预处理方法，其特征在于，确定无法采用人工质检的方式进行有声图书的图书数据的质检处理，具体包括：

4.如权利要求3所述的语音识别模型的有声图书的数据预处理方法，其特征在于，所述质检处理繁忙日期为上架需求图书的数量不在预设需求数量区间内的日期。

5.如权利要求1所述的...

【技术特征摘要】

1.一种语音识别模型的有声图书的数据预处理方法，其特征在于，具体包括：

5.如权利要求1所述的语音识别模型的有声图书的数据预处理方法，其特征在于，所述用户评论数据包括在不同的有声图书下的评论数量以及...

【专利技术属性】
技术研发人员：徐悦，徐志清，欧阳双，姜永胜，徐志勇，
申请(专利权)人：华语之声传媒杭州有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人