文本修正方法、装置、计算机设备、存储介质和程序产品制造方法及图纸

技术编号:33655789 阅读:12 留言:0更新日期:2022-06-02 20:35
本申请涉及一种文本修正方法、装置、计算机设备、存储介质和程序产品,属于文本修正技术领域。所述方法包括:接收发送终端发送的待修正文本信息,待修正文本信息为发送终端将接收到的语音信息进行转换后得到的;基于预设的易错文本词库,对待修正文本信息进行修正处理,得到目标文本,易错文本词库中包括多个错误词句以及多个错误词句所分别对应的正确词句;将目标文本发送至接收终端中。采用本方法能够实现对语音信息转换后的文本信息进行修正。正。正。

【技术实现步骤摘要】
文本修正方法、装置、计算机设备、存储介质和程序产品


[0001]本申请涉及文本修正
,特别是涉及一种文本修正方法、装置、计算机设备、存储介质和程序产品。

技术介绍

[0002]在互联网通信交流过程中,由于语音信息的接听效率远低于文本的阅读效率,导致越来越多的人会将语音信息转化为文本信息,因而常常需要用到语音转文本技术,现有技术中,多是发送终端将语音信息发送至接收终端,再由接收终端将语音信息转换为文本信息,但由于很多人的发音并不规范,导致文本信息中时常出现较多的错误词句,因此,如何对语音信息转换后的文本信息进行修正成为了一个亟需解决的问题。

技术实现思路

[0003]基于此,有必要针对上述技术问题,提供一种能够对语音信息转换后的文本信息进行修正的文本修正方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0004]第一方面,本申请提供了一种文本修正方法,用于服务器中,该方法包括:接收发送终端发送的待修正文本信息,待修正文本信息为发送终端将接收到的语音信息进行转换后得到的;基于预设的易错文本词库,对待修正文本信息进行修正处理,得到目标文本,易错文本词库中包括多个错误词句以及多个错误词句所分别对应的正确词句;将目标文本发送至接收终端中。
[0005]在其中一个实施例中,基于预设的易错文本词库,对待修正文本信息进行修正处理,包括:基于易错文本词库,确定待修正文本信息中是否存在目标错误词句;若存在目标错误词句,则将目标错误词句替换为目标错误词句对应的易错文本词库中的目标正确词句
[0006]在其中一个实施例中,该方法还包括:若不存在目标错误词句,则将待修正文本信息作为目标文本发送至接收终端中。
[0007]在其中一个实施例中,基于易错文本词库,确定待修正文本信息中是否存在目标错误词句,包括:将待修正文本信息划分为多个待检测语句,并将各待检测语句逐一与易错文本词库中的各错误词句进行相似度对比;根据多个相似度对比结果,确定待修正文本信息中是否存在目标错误词句。
[0008]在其中一个实施例中,若存在目标错误词句,则将目标错误词句替换为目标错误词句对应的易错文本词库中的目标正确词句,包括:对于各相似度对比结果,若相似度对比结果大于预设的相似阈值,则将相似度对比结果对应的待检测语句作为目标错误词句;基于易错文本词库,确定目标错误词句对应的易错文本词库中的目标正确语句;将目标错误词句替换为目标正确语句。
[0009]在其中一个实施例中,易错文本词库的创建过程包括:接收多个终端发送的多个错误语句以及多个错误语句对应的正确语句,并将多个错误语句和多个正确语句进行集
合,得到易错文本词库。
[0010]第二方面,本申请还提供了一种文本修正装置,该装置包括:接收模块,用于接收发送终端发送的待修正文本信息,待修正文本信息为发送终端将接收到的语音信息进行转换后得到的;修正模块,用于基于预设的易错文本词库,对待修正文本信息进行修正处理,得到目标文本,易错文本词库中包括多个错误词句以及多个错误词句所分别对应的正确词句;发送模块,用于将目标文本发送至接收终端中。
[0011]在其中一个实施例中,该修正模块,具体用于:基于易错文本词库,确定待修正文本信息中是否存在目标错误词句;若存在目标错误词句,则将目标错误词句替换为目标错误词句对应的易错文本词库中的目标正确词句。
[0012]在其中一个实施例中,该发送模块,具体用于:若不存在目标错误词句,则将待修正文本信息作为目标文本发送至接收终端中。
[0013]在其中一个实施例中,该修正模块,具体用于:将待修正文本信息划分为多个待检测语句,并将各待检测语句逐一与易错文本词库中的各错误词句进行相似度对比;根据多个相似度对比结果,确定待修正文本信息中是否存在目标错误词句。
[0014]在其中一个实施例中,该修正模块,具体用于:对于各相似度对比结果,若相似度对比结果大于预设的相似阈值,则将相似度对比结果对应的待检测语句作为目标错误词句;基于易错文本词库,确定目标错误词句对应的易错文本词库中的目标正确语句;将目标错误词句替换为目标正确语句。
[0015]在其中一个实施例中,易错文本词库的创建过程包括:接收多个终端发送的多个错误语句以及多个错误语句对应的正确语句,并将多个错误语句和多个正确语句进行集合,得到易错文本词库。
[0016]第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行该计算机程序时实现上述第一方面任一项所述的方法的步骤。
[0017]第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述第一方面任一项所述的方法的步骤。
[0018]第五方面,本申请还提供了一种计算机程序产品。该计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述第一方面任一项所述的方法的步骤。
[0019]本申请实施例提供的技术方案带来的有益效果至少包括:
[0020]在本申请实施例中,首先,接收发送终端发送的待修正文本信息,其中,待修正文本信息为发送终端将接收到的语音信息进行转换后得到的;其次,基于预设的易错文本词库,对待修正文本信息进行修正处理,得到目标文本,其中,易错文本词库中包括多个错误词句以及多个错误词句所分别对应的正确词句;最后,将目标文本发送至接收终端中。由此可见,本申请实施例基于易错文本词库,提供了一种对语音信息转换后的文本信息进行修正的方法。
附图说明
[0021]图1为本申请实施例提供的一种实施环境示意图;
[0022]图2为本申请实施例提供的一种文本修正方法的流程图;
Response,简称IIR数字滤波器),用窗函数设计非递归型滤波器(Finite Impulse Response,简称FIR滤波器);最后,基于IIR数字滤波器以及FIR滤波器对语音信息进行滤波降噪处理。在本申请实施例中,先对获取的语音信息进行滤波降噪处理,可以去除语音信息中附带的干扰源,便于提高后续语音信息识别为待修正文本信息的精准度。
[0037]在对语音信息进行滤波降噪处理之后,还可以对滤波降噪处理后的语音信息作离散傅里叶变换,并对变换后的数据取模平方得到离散的功率谱,随后使用一组Mel带通滤波器进行带通滤波,最终获取语音信息的对数频谱,如此,便将语音信息嵌入到离散余弦变换域的各系数中。获取到语音信息的对数频谱之后,可以基于HTK,将语音信息转换为待修正文本信息。
[0038]步骤202、服务器基于预设的易错文本词库,对待修正文本信息进行修正处理,得到目标文本。
[0039]其中,易错文本词库中包括多个错误词句以及多个错误词句所分别对应的正确词句;修正处理是指对待修正文本信息中的错误语句进行修正。
[0040]可选的,易错文本词库的创建过程可以包括:接收多个终端发送的多个错误语句以及多个错误语句对应的正确语句,并将多个错误语句和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本修正方法,其特征在于,用于服务器中,所述方法包括:接收发送终端发送的待修正文本信息,所述待修正文本信息为所述发送终端将接收到的语音信息进行转换后得到的;基于预设的易错文本词库,对所述待修正文本信息进行修正处理,得到目标文本,所述易错文本词库中包括多个错误词句以及多个所述错误词句所分别对应的正确词句;将所述目标文本发送至接收终端中。2.根据权利要求1所述的方法,其特征在于,所述基于预设的易错文本词库,对所述待修正文本信息进行修正处理,包括:基于所述易错文本词库,确定所述待修正文本信息中是否存在目标错误词句;若存在所述目标错误词句,则将所述目标错误词句替换为所述目标错误词句对应的所述易错文本词库中的目标正确词句。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:若不存在所述目标错误词句,则将所述待修正文本信息作为所述目标文本发送至所述接收终端中。4.根据权利要求2所述的方法,其特征在于,所述基于所述易错文本词库,确定所述待修正文本信息中是否存在目标错误词句,包括:将所述待修正文本信息划分为多个待检测语句,并将各所述待检测语句逐一与所述易错文本词库中的各错误词句进行相似度对比;根据多个相似度对比结果,确定所述待修正文本信息中是否存在目标错误词句。5.根据权利要求4所述的方法,其特征在于,所述若存在所述目标错误词句,则将所述目标错误词句替换为所述目标错误词句对应的所述易错文本词库中的目标正确词句,包括:对于各所述相似度对比结果,若所...

【专利技术属性】
技术研发人员:崔洋洋余俊澎
申请(专利权)人:游密科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1