智能提词方法及装置制造方法及图纸

技术编号:34802312 阅读:13 留言:0更新日期:2022-09-03 20:09
本公开实施例公开了一种智能提词方法及装置,包括:对实时获取的语音实时转化为文本,并当文本达到第一预设长度后作为待匹配文本;在第一匹配模式下,利用滑动窗口对所述待匹配文本、以及与其对应源文本进行动态匹配;在第一匹配模式下,如果动态匹配得到的匹配度大于或等于预设阈值,则切入第二匹配模式,并将当前滑动窗口的结束位置处之后的文本作为待匹配的源文本;在第二匹配模式下,对当前语音实时转化为第二预设长度的新文本,将新文本、待匹配的源文本中第三预设长度的文本进行匹配;如果匹配成功,则对第三预设长度之后的待匹配源文本进行可视化编辑。解决了语音识别率达不到100%导致提词不准确问题。到100%导致提词不准确问题。到100%导致提词不准确问题。

【技术实现步骤摘要】
智能提词方法及装置


[0001]本公开涉及数据处理
,具体涉及到一种智能提词方法及装置。

技术介绍

[0002]在用户读稿过程中,可能需要中途脱稿,然后再回到原稿件朗读,此过程需要进行文本追踪以方便用户回到原稿件对应的位置进行朗读。
[0003]相关技术中,文本跟踪精度低,导致文本的定位错误率高。

技术实现思路

[0004]本公开的主要目的在于提供一种智能提词方法及装置。
[0005]为了实现上述目的,根据本公开的第一方面,提供了一种智能提词方法,包括:对实时获取的语音实时转化为文本,并当文本达到第一预设长度后作为待匹配文本;在第一匹配模式下,利用滑动窗口对所述待匹配文本、以及与其对应源文本进行动态匹配,其中,所述滑动窗口在所述源文本上以动态的步幅移动;在第一匹配模式下,如果动态匹配得到的匹配度大于或等于预设阈值,则切入第二匹配模式,并将当前滑动窗口的结束位置处之后的文本作为待匹配的源文本;在第二匹配模式下,对当前语音实时转化为第二预设长度的新文本,将新文本、待匹配的源文本中第三预设长度的文本进行匹配,其中,所述第三预设长度大于第二预设长度、并且第二预设长度小于第一预设长度;如果匹配成功,则对第三预设长度之后的待匹配源文本进行可视化编辑。
[0006]可选地,方法还包括:如果匹配不成功,则重新在第二匹配模式下进行匹配;和/或,当匹配不成功的次数达到N次、或者匹配后的匹配度不符合预设值,则重新在第一匹配模式下进行匹配。
[0007]可选地,滑动窗口在所述源文本上以动态的步幅移动包括:如果待匹配文本、以及与其对应源文本匹配度低于预设匹配度阈值,则将当前的步幅调大;如果待匹配文本、以及与其对应源文本匹配度大于预设匹配度阈值,则将当前的步幅调小。
[0008]可选地,在第一匹配模式下,如果匹配度小于预设阈值,则删除待匹配内容;实时获取当前新的语音并实时转化为新文本,并当该新文本达到第一预设长度后作为新待匹配文本;在第一模式下,利用滑动窗口对所述新待匹配文本、以及与其对应源文本进行动态匹配。
[0009]可选地,在第一匹配模式下,基于最长公共子序列、与待匹配文本的长度确定第一匹配模式下的匹配度,其中,所述最长公共子序列为源文本中能与待匹配文本匹配上的最大长度的文本。
[0010]可选地,方法还包括:预先将源文本转化为无标点符号的文本,并将无标点符号的文本中文字的各个位置与源文本中相应文字的位置进行映射。
[0011]根据本公开的第二方面,提供了一种智能提词装置,包括:语音识别单元,被配置成对实时获取的语音实时转化为文本,并当文本达到第一预设长度后作为待匹配文本;第
一匹配单元,被配置成在第一匹配模式下,利用滑动窗口对所述待匹配文本、以及与其对应源文本进行动态匹配,其中,所述滑动窗口在所述源文本上以动态的步幅移动;第二匹配单元,被配置成在第一匹配模式下,如果动态匹配得到的匹配度大于或等于预设阈值,则切入第二匹配模式,并将当前滑动窗口的结束位置处之后的文本作为待匹配的源文本;在第二匹配模式下,对当前语音实时转化为第二预设长度的新文本,将新文本、待匹配的源文本中第三预设长度的文本进行匹配,其中,所述第三预设长度大于第二预设长度、并且第二预设长度小于第一预设长度;文本修饰单元,被配置成如果匹配成功,则对第三预设长度之后的待匹配源文本进行可视化编辑。
[0012]可选地,所述装置还被配置成:如果匹配不成功,则重新在第二匹配模式下进行匹配;和/或,当匹配不成功的次数达到N次、或者匹配后的匹配度不符合预设值,则重新在第一匹配模式下进行匹配。
[0013]根据本公开的第三方面,提供了一种计算机可读存储介质,存储有计算机指令,所述计算机指令用于使所述计算机执行第一方面任意一项实现方式所述的智能提词方法。
[0014]根据本公开的第四方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行第一方面任意一项实现方式所述的智能提词方法。
[0015]在本公开实施例智能提词方法及装置中,包括:对实时获取的语音实时转化为文本,并当文本达到第一预设长度后作为待匹配文本;在第一匹配模式下,利用滑动窗口对所述待匹配文本、以及与其对应源文本进行动态匹配,其中,所述滑动窗口在所述源文本上以动态的步幅移动;在第一匹配模式下,如果动态匹配得到的匹配度大于或等于预设阈值,则切入第二匹配模式,并将当前滑动窗口的结束位置处之后的文本作为待匹配的源文本;在第二匹配模式下,对当前语音实时转化为第二预设长度的新文本,将新文本、待匹配的源文本中第三预设长度的文本进行匹配,其中,所述第三预设长度大于第二预设长度、并且第二预设长度小于第一预设长度;如果匹配成功,则对第三预设长度之后的待匹配源文本进行可视化编辑。通过动态自适应滑动窗口搜索,多模式处理提高了了智能提词的准确度,解决了语音识别率达不到100%导致提词不准确问题。
附图说明
[0016]为了更清楚地说明本公开具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]图1是根据本公开实施例的智能提词方法流程图;
[0018]图2

图6是根据本公开实施例的智能提词方法应用示意图;
[0019]图7是根据本公开实施例的电子设备的示意图。
具体实施方式
[0020]为了使本
的人员更好地理解本公开方案,下面将结合本公开实施例中的
附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
[0021]需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0022]需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
[0023]根据本公开实施例,提供了一种智能提词方法,如图1所示,该方法包括如下的步骤101至步骤105:
...

【技术保护点】

【技术特征摘要】
1.一种智能提词方法,其特征在于,包括:对实时获取的语音实时转化为文本,并当文本达到第一预设长度后作为待匹配文本;在第一匹配模式下,利用滑动窗口对所述待匹配文本、以及与其对应源文本进行动态匹配,其中,所述滑动窗口在所述源文本上以动态的步幅移动;在第一匹配模式下,如果动态匹配得到的匹配度大于或等于预设阈值,则切入第二匹配模式,并将当前滑动窗口的结束位置处之后的文本作为待匹配的源文本;在第二匹配模式下,对当前语音实时转化为第二预设长度的新文本,将新文本、待匹配的源文本中第三预设长度的文本进行匹配,其中,所述第三预设长度大于第二预设长度、并且第二预设长度小于第一预设长度;如果匹配成功,则对第三预设长度之后的待匹配源文本进行可视化编辑。2.如权利要求1所述的智能提词方法,其特征在于,所述方法还包括:如果匹配不成功,则重新在第二匹配模式下进行匹配;和/或,当匹配不成功的次数达到N次、或者匹配后的匹配度不符合预设值,则重新在第一匹配模式下进行匹配。3.根据权利要求1所述的智能提词方法,其特征在于,滑动窗口在所述源文本上以动态的步幅移动包括:如果待匹配文本、以及与其对应源文本匹配度低于预设匹配度阈值,则将当前的步幅调大;如果待匹配文本、以及与其对应源文本匹配度大于预设匹配度阈值,则将当前的步幅调小。4.根据权利要求1所述的智能提词方法,其特征在于,在第一匹配模式下,如果匹配度小于预设阈值,则删除待匹配内容;实时获取当前新的语音并实时转化为新文本,并当该新文本达到第一预设长度后作为新待匹配文本;在第一模式下,利用滑动窗口对所述新待匹配文本、以及与其对应源文本进行动态匹配。5.根据权利要求1所述的智能提词方法,其特征在于,在第一匹配模式下,基于最长公共子序列、与待匹配文本的长度确定第一匹配模式下的匹配度,其中,所述最长公共子序列为源文本中能与待匹配文本匹配上的最大长度的文本。6.根据权利要...

【专利技术属性】
技术研发人员:高栈年陈涛
申请(专利权)人:苏州萝卜电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1