用于语音转写的方法、装置、开发平台和存储介质制造方法及图纸

技术编号：39058052 阅读：16 留言：0更新日期：2023-10-12 19:51

本申请涉及深度学习技术领域，公开一种用于语音转写的方法，包括：利用已配置的语音转写模型对测试语音进行识别和转写，并将转写结果呈现给所述用户；在转写结果不满足所述用户需求的情况下，对语音转写模型进行调整；在转写结果满足所述用户需求的情况下，发布语音转写模型；基于发布的语音转写模型，进行语音转写。相较于相关技术，本申请是把语音转写模型部署于平台化配置，基于用户需求进行开发，从而使得让用户也参与了开发和测试的过程。让用户可以更加快速的提出建议，也方便开发人员进行优化，进而大大缩短交付周期，提高开发效率。本申请还公开一种用于语音转写的装置、开发平台和存储介质。台和存储介质。台和存储介质。

全部详细技术资料下载

【技术实现步骤摘要】
用于语音转写的方法、装置、开发平台和存储介质

[0001]本申请涉及深度学习
，具体而言，涉及一种用于语音转写的方法、装置、开发平台和存储介质。

技术介绍

[0002]目前，在语音转写这个细分领域中，语音转写项目的需求对接与实施交付过程中，主要有两点需求，一是针对不同行业会有很多的领域热词需要转写准确；二是客户有很多个性化的需求，而客户也很难一次性表达清楚所有的定制化需求。这就需要在语音转写项目的开发过程中不断的进行优化调整，这个过程中需要有产品或者项目交付人员进行维护。每一次迭代优化从发现到最后完成，中间需要很多时间，实效性低，人员投入高。
[0003]相关技术公开了一种用于语音转写结合用户文本的热词提取方法，方案包括：对用户提供的行业语音文本即用户文本，进行分词预处理；对用户文本的分词预处理结果进行词频分析，获取用户当前文本词频；分析获取在用户当前文本词频中大于设置的词频阈值n1，而在已有语音转写模型训练语料词频中小于设置的词频阈值n2的词，作为用户当前热词集；将用户当前热词集与历史热词库进行递归合并，重新调节热词的权重得到用户当前热词库；基于用户当前热词库，进行语音转文本。简述而言是结合用户提供的有关其行业的重点词汇，形成热词文本，从而在开发语音转写项目时，着重注意这些词汇的识别，从而提高了语音转写的准确率。
[0004]相关技术的问题在于，通过结合用户提供的热词文本，虽然提高了转写的准确性。但对于客户提出的个性化需求，还是需要多次进行迭代优化，这样就需要在模型完成后多次返工，导致项目周期...

【技术保护点】

【技术特征摘要】
1.一种用于语音转写的方法，其特征在于，包括：利用已配置的语音转写模型对测试语音进行识别和转写，并将转写结果呈现给所述用户；在转写结果不满足所述用户需求的情况下，对语音转写模型进行调整；在转写结果满足所述用户需求的情况下，发布语音转写模型；基于发布的语音转写模型，进行语音转写。2.根据权利要求1所述的方法，其特征在于，按如下方式配置语音转写模型：在平台上部署语音转写模型；获取应用场景，并配置于所述语音转写模型；获取热词词典，并配置于所述语音转写模型。3.根据权利要求2所述的方法，其特征在于，所述获取热词词典，包括：新建热词词典，或；获取转写需求，将所述转写需求转化为热词词典，或；根据已配置的所述应用场景，在数据库中检索与所述应用场景匹配的热词词典。4.根据权利要求1所述的方法，其特征在于，所述对测试语音进行识别和转写，并将转写结果呈现给所述用户，包括：接收用户上传的语音的测试语音，或；根据已配置的所述应用场景，在数据库中检索对应场景的测试语音，或；接收用户在线录制的测试语音。5.根据权利要求1所述的方法，其特征在于，所述在转写结果不满足所...

【专利技术属性】
技术研发人员：朱会峰，李英汉，张俞静，刘莹，闫广群，吴明辉，
申请(专利权)人：北京明略昭辉科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人