双轨道音频对话转换文字的方法、装置、设备及存储介质制造方法及图纸

技术编号：45875666 阅读：12 留言：0更新日期：2025-07-19 11:34

本申请涉及一种双轨道音频对话转换文字的方法、装置、设备及存储介质。该方法包括：对双轨道音频对话进行声道分离处理，获得所述双轨道音频对话中第一声道的第一音频、第二声道的第二音频；分别对所述第一音频、所述第二音频进行文字转换，获得所述第一音频对应的第一文字、所述第二音频对应的第二文字；根据所述第一文字和第二文字，构建与所述双轨道音频对话的语境对应的文字对话。本申请提供的方案，能够处理复杂的双轨道音频对话，能够提高双轨道音频对话转换文字的准确性和效率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音处理，尤其涉及一种双轨道音频对话转换文字的方法、装置、设备及存储介质。

技术介绍

1、音频转换文字的相关技术中，依赖对声音信号的解析和语音识别，使用声学模型分析音频信号的频谱、波形和语音特征，然后结合语言模型进行文本转换；或者通过语音识别软件识别音频中的语音单元并将其映射到文字表达中。音频转换文字的相关技术中，需要使用大量的训练数据对声学模型、语言模型和语音识别软件进行模型训练，以使声学模型、语言模型和语音识别软件能够涵盖多种语音和口音，提高音频转换文字的转换准确性。

2、在双轨道音频对话中，对话中有两个或多个声音源同时存在，音频转换文字的相关技术，难以有效分离和处理多个声音源信号，难以确定哪些声音对应于哪个讲话者，导致转换的准确性受到影响，音频转换文字的相关技术面临挑战。

3、总之，音频转换文字的相关技术，难以处理双轨道音频对话的复杂性，导致双轨道音频对话转换文字的准确性和效率较低。

技术实现思路

1、为解决或部分解决相关技术中存在的问题，本申请提供...

【技术保护点】

1.一种双轨道音频对话转换文字的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述分别对所述第一音频、所述第二音频进行文字转换，获得所述第一音频对应的第一文字、所述第二音频对应的第二文字，包括：

3.根据权利要求2所述的方法，其特征在于，所述分别对所述第一音频、所述第二音频进行降噪处理，获得降噪后的所述第一音频对应的第一降噪音频、所述第二音频对应的第二降噪音频，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述第一文字和第二文字，构建与所述双轨道音频对话的语境对应的文字对话，包括：

5.根据权利要求4所述的...

【技术特征摘要】

1.一种双轨道音频对话转换文字的方法，其特征在于，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述第一文字和第二文字，构建与所述双轨道音频对话的语境对应的文字对话，包括：

5.根据权利要求4所述的方法，其特征在于，所述通过语境理解模型，根据所述第一文字和第二文...

【专利技术属性】
技术研发人员：夏杰民，
申请(专利权)人：广州探途天下科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人