用于语音转写的方法、装置、开发平台和存储介质制造方法及图纸

技术编号:39058052 阅读:16 留言:0更新日期:2023-10-12 19:51
本申请涉及深度学习技术领域,公开一种用于语音转写的方法,包括:利用已配置的语音转写模型对测试语音进行识别和转写,并将转写结果呈现给所述用户;在转写结果不满足所述用户需求的情况下,对语音转写模型进行调整;在转写结果满足所述用户需求的情况下,发布语音转写模型;基于发布的语音转写模型,进行语音转写。相较于相关技术,本申请是把语音转写模型部署于平台化配置,基于用户需求进行开发,从而使得让用户也参与了开发和测试的过程。让用户可以更加快速的提出建议,也方便开发人员进行优化,进而大大缩短交付周期,提高开发效率。本申请还公开一种用于语音转写的装置、开发平台和存储介质。台和存储介质。台和存储介质。

【技术实现步骤摘要】
用于语音转写的方法、装置、开发平台和存储介质


[0001]本申请涉及深度学习
,具体而言,涉及一种用于语音转写的方法、装置、开发平台和存储介质。

技术介绍

[0002]目前,在语音转写这个细分领域中,语音转写项目的需求对接与实施交付过程中,主要有两点需求,一是针对不同行业会有很多的领域热词需要转写准确;二是客户有很多个性化的需求,而客户也很难一次性表达清楚所有的定制化需求。这就需要在语音转写项目的开发过程中不断的进行优化调整,这个过程中需要有产品或者项目交付人员进行维护。每一次迭代优化从发现到最后完成,中间需要很多时间,实效性低,人员投入高。
[0003]相关技术公开了一种用于语音转写结合用户文本的热词提取方法,方案包括:对用户提供的行业语音文本即用户文本,进行分词预处理;对用户文本的分词预处理结果进行词频分析,获取用户当前文本词频;分析获取在用户当前文本词频中大于设置的词频阈值n1,而在已有语音转写模型训练语料词频中小于设置的词频阈值n2的词,作为用户当前热词集;将用户当前热词集与历史热词库进行递归合并,重新调节热词的权重得到用户当前热词库;基于用户当前热词库,进行语音转文本。简述而言是结合用户提供的有关其行业的重点词汇,形成热词文本,从而在开发语音转写项目时,着重注意这些词汇的识别,从而提高了语音转写的准确率。
[0004]相关技术的问题在于,通过结合用户提供的热词文本,虽然提高了转写的准确性。但对于客户提出的个性化需求,还是需要多次进行迭代优化,这样就需要在模型完成后多次返工,导致项目周期较长,开发效率较低。

技术实现思路

[0005]为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
[0006]本公开实施例提供了一种用于语音转写的方法、装置、开发平台和存储介质,可以缩短交付周期,提高开发效率。
[0007]在一些实施例中,用于语音转写的方法包括:
[0008]利用已配置的语音转写模型对测试语音进行识别和转写,并将转写结果呈现给用户;
[0009]在转写结果不满足用户需求的情况下,对语音转写模型进行调整;
[0010]在转写结果满足用户需求的情况下,发布语音转写模型;
[0011]基于发布的语音转写模型,进行语音转写。
[0012]可选地,按如下方式配置语音转写模型:
[0013]在平台上部署语音转写模型;
[0014]获取应用场景,并配置于语音转写模型;
[0015]获取热词词典,并配置于语音转写模型。
[0016]可选地,获取热词词典,包括:
[0017]新建热词词典,或;
[0018]获取转写需求,将转写需求转化为热词词典,或;
[0019]根据已配置的应用场景,在数据库中检索与应用场景匹配的热词词典。
[0020]可选地,对测试语音进行识别和转写,并将转写结果呈现给用户,包括:
[0021]接收用户上传的语音的测试语音,或;
[0022]根据已配置的应用场景,在数据库中检索对应场景的测试语音,或;
[0023]接收用户在线录制的测试语音。
[0024]可选地,在转写结果不满足用户需求的情况下,对语音转写模型进行调整,包括:
[0025]在转写结果不满足用户需求的情况下,根据用户的输入指令,对已配置于语音转写模型的热词词典进行修改,或;
[0026]在转写结果不满足用户需求的情况下,删除已配置于语音转写模型的热词词典,并根据用户的输入指令重新配置热词词典。
[0027]可选地,将转写结果呈现给用户,包括:
[0028]对输入的语音进行转写识别后,向用户显示未配置热词词典的转写结果和配置热词词典的转写结果。
[0029]可选地,用于语音转写的方法还包括:
[0030]将语音转写的测试语音和测试结果存储至应用场景对应的数据库,以便再次调用。
[0031]值得注意的是,本申请中提到的平台是指开发平台。平台是一个相对概念,任何软件都可以叫平台,也可以叫工具。一般理解的平台就是能够让用户自己在上面进行开发的软件。而开发平台可以是一种服务器、台式机、笔记本电脑上的某款软件等。可以通过连接互联网进行通信连接,具有智能控制,智能应用的特征,运作过程往往依赖于物联网、互联网以及电子芯片等现代技术的应用和处理。
[0032]在一些实施例中,所述用于语音转写的装置包括:处理器和存储有程序指令的存储器,所述处理器被配置为在运行所述程序指令时,执行上述的用于语音转写的方法。
[0033]在一些实施例中,所述开发平台包括:如上述实施例所述的用于语音转写的装置。
[0034]本公开实施例提供的用于语音转写的方法、装置、开发平台和存储介质,可以实现以下技术效果:
[0035]本专利技术采用深度学习
的技术手段,是一种基于平台化配置的语音转写方法。首先基于平台部署通用的语音转写模型,进而对用户上传的语音进行识别和转写。在转写之后,可以基于平台将转写的结果同时呈现给用户,这样就可以了解用户是否满足当前的转写结果。如果客户认为转写结果不够精准或并不符合客户习惯,那么就可以立即对模型提出建议,从而开发人员可以立刻进行调整。最后将用户满意的语音转写模型在平台上发布。相关技术中都是直接用模型进行语音转写处理,不能很好的满足客户的个性化需求。而本申请是把语音转写模型部署于平台化配置,基于用户需求进行开发,从而使得让用户也参与了开发和测试的过程。让用户可以更加快速的提出建议,也方便开发人员进行优化,
进而大大缩短交付周期,提高开发效率。
[0036]以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
附图说明
[0037]一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:
[0038]图1是本公开实施例提供的用于语音转写的方法的示意图;
[0039]图2是本公开实施例提供的又一个用于语音转写的方法的示意图;
[0040]图3是本公开实施例提供的基于平台部署的语音转写模型的使用流程示意图;
[0041]图4是本公开实施例提供的基于平台部署的语音转写模型的另一个使用流程示意图;
[0042]图5是本公开实施例提供的基于平台部署的语音转写模型的另一个使用流程示意图;
[0043]图6是本公开实施例提供的基于平台部署的语音转写模型的另一个使用流程示意图;
[0044]图7是本公开实施例提供的一个用于语音转写的装置的示意图。
具体实施方式
[0045]为了能够更加详尽地了解本公开实施例的特点与
技术实现思路
,下面结合附图对本公开实施例的实现进行详细阐述,所附附图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于语音转写的方法,其特征在于,包括:利用已配置的语音转写模型对测试语音进行识别和转写,并将转写结果呈现给所述用户;在转写结果不满足所述用户需求的情况下,对语音转写模型进行调整;在转写结果满足所述用户需求的情况下,发布语音转写模型;基于发布的语音转写模型,进行语音转写。2.根据权利要求1所述的方法,其特征在于,按如下方式配置语音转写模型:在平台上部署语音转写模型;获取应用场景,并配置于所述语音转写模型;获取热词词典,并配置于所述语音转写模型。3.根据权利要求2所述的方法,其特征在于,所述获取热词词典,包括:新建热词词典,或;获取转写需求,将所述转写需求转化为热词词典,或;根据已配置的所述应用场景,在数据库中检索与所述应用场景匹配的热词词典。4.根据权利要求1所述的方法,其特征在于,所述对测试语音进行识别和转写,并将转写结果呈现给所述用户,包括:接收用户上传的语音的测试语音,或;根据已配置的所述应用场景,在数据库中检索对应场景的测试语音,或;接收用户在线录制的测试语音。5.根据权利要求1所述的方法,其特征在于,所述在转写结果不满足所...

【专利技术属性】
技术研发人员:朱会峰李英汉张俞静刘莹闫广群吴明辉
申请(专利权)人:北京明略昭辉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1