语音文件的处理方法、装置、计算机存储介质和终端制造方法及图纸

技术编号：20223157 阅读：20 留言：0更新日期：2019-01-28 21:16

本发明专利技术公开了一种语音文件的处理方法、装置、计算机存储介质及终端，属于语音处理领域。所述方法包括：获取待处理的语音文件，该语音文件中包括m种声音特征的语音数据，m为大于1的整数；对该语音文件进行声纹识别，得到m种声音特征的语音数据；对识别出的每种声音特征的语音数据进行文本转换，得到每种声音特征的语音数据对应的文本；按照不同的显示格式，显示m种声音特征的语音数据对应的文本。通过本发明专利技术，可以将不同说话人的文本转换结果用不同的显示格式显示，便于用户区分不同说话人的说话内容，扩展了语音文件的显示方式。

全部详细技术资料下载

【技术实现步骤摘要】
语音文件的处理方法、装置、计算机存储介质和终端
本专利技术涉及语音
，特别涉及一种语音文件的处理方法、装置、计算机存储介质和终端。
技术介绍
目前，为了便于用户快速获知语音内容，可以将待收听的语音文件转换为文本，然后将转换后的文本展示给用户，如此，用户无需收听语音文件，通过展示的文本即可快速获知语音内容。相关技术中，提供了一种语音文件的处理方法，包括：对于待处理的任一语音文件，先对该语音文件进行文本转换，得到该语音文件对应的文本，然后按照统一的显示格式，显示该语音文件对应的文本，也即是，该语音文件的全部语音内容均采用统一的显示格式进行显示。相关技术中语音文件的显示形式单一，当语音文件中包括多个说话人的语音，根据统一的显示格式，用户将无法区分出不同说话人的说话内容。
技术实现思路
本专利技术实施例提供了一种语音文件的处理方法、装置、计算机存储介质和终端，可以用于解决相关技术中存在的语音文件的显示形式单一，无法区分不同说话人的说话内容的问题。所述技术方案如下：一方面，提供了一种语音文件的处理方法，所述方法包括：获取待处理的语音文件，所述语音文件中包括m种声音特征的语音数据，所述m为大于1的整数；对所述语音文件进行声纹识别，得到所述m种声音特征的语音数据；对识别出的每种声音特征的语音数据进行文本转换，得到每种声音特征的语音数据对应的文本；按照不同的显示格式，显示所述m种声音特征的语音数据对应的文本。一方面，提供了一种语音文件的处理装置，所述装置包括：获取模块，用于获取待处理的语音文件，所述语音文件包括m种声音特征的语音数据，所述为大于1的整数；识别模块，用于对...

【技术保护点】
1.一种语音文件的处理方法，其特征在于，所述方法包括：获取待处理的语音文件，所述语音文件中包括m种声音特征的语音数据，所述m为大于1的整数；对所述语音文件进行声纹识别，得到所述m种声音特征的语音数据；对识别出的每种声音特征的语音数据进行文本转换，得到每种声音特征的语音数据对应的文本；按照不同的显示格式，显示所述m种声音特征的语音数据对应的文本。

【技术特征摘要】
1.一种语音文件的处理方法，其特征在于，所述方法包括：获取待处理的语音文件，所述语音文件中包括m种声音特征的语音数据，所述m为大于1的整数；对所述语音文件进行声纹识别，得到所述m种声音特征的语音数据；对识别出的每种声音特征的语音数据进行文本转换，得到每种声音特征的语音数据对应的文本；按照不同的显示格式，显示所述m种声音特征的语音数据对应的文本。2.如权利要求1所述的方法，其特征在于，所述对所述语音文件进行声纹识别，包括：对所述语音文件进行声纹识别，以从所述语音文件中识别出所述m种声音特征；根据所述m种声音特征中的每种声音特征，确定所述语音文件中每种声音特征的语音数据的所在位置。3.如权利要求2所述的方法，其特征在于，所述对识别出的每种声音特征的语音数据进行文本转换，得到每种声音特征的语音数据对应的文本，包括：按照所述语音文件的语音顺序，对所述语音文件进行文本转换，得到所述语音文件对应的文本；对于所述m种声音特征中的每种声音特征，根据所述语音文件中所述声音特征的语音数据的所在位置，确定所述语音文件中所述声音特征的语音数据对应的文本的所在位置；所述按照不同的显示格式，显示所述m种声音特征的语音数据对应的文本，包括：在所述m种声音特征的语音数据对应的文本的所在位置上，按照不同的显示格式，显示所述m种声音特征的语音数据对应的文本。4.如权利要求1所述的方法，其特征在于，所述对所述语音文件进行声纹识别，包括：按照所述语音文件的语音顺序，对所述语音文件进行声纹识别，以从所述语音文件中识别出按序排列的n个语音片段，所述n个语音片段中包括所述m种声音特征，且所述n个语音片段中相邻的两个语音片段的声音特征不同，所述n大于或等于所述m。5.如权利要求4所述的方法，其特征在于，所述对识别出的每种声音特征的语音数据进行文本转换，得到每种声音特征的语音数据对应的文本，包括：对识别出的每个语音片段进行文本转换，得到每个语音片段对应的文本；所述按照不同的显示格式，显示所述m种声音特征的语音数据对应的文本，包括：对于识别出的第一个语音片段，从预先设置的多个显示格式中确定第一显示格式，按照所述第一显示格式显示所述第一个语音片段对应的文本；对于所述第一个语音片段之后的任一语音片段，从预先设置的多个显示格式中确定与第二显示格式不同的第三显示格式，按照所述第三显示格式显示所述语音片段对应的文本，所述第二显示格式是上一个语音片段对应的文本的显示格式。6.如权利要求1-5任一所述的方法，其特征在于，显示格式包括颜色样式、字体样式、字体背景样式、文本框样式和文本的标签样式中的至少一种。7.一种语音文件的处理装置，其特征在于，所述装置包括：获取模块，用于获取待处理的语音文件，所述语音文件包括m种声音...

【专利技术属性】
技术研发人员：查文，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人