System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种语音文本转换处理方法、装置、系统及介质制造方法及图纸_技高网

一种语音文本转换处理方法、装置、系统及介质制造方法及图纸

技术编号:43282868 阅读:21 留言:0更新日期:2024-11-12 16:05
本发明专利技术公开了一种语音文本转换处理的方法、装置、系统及介质,方法包括:获取第一语音数据和第二语音数据;将所述第一语音数据和第二语音数据转换成第一语音文本和第二语音文本;将第一语音文本和第二语音文本转换为第一文本向量和第二文本向量;计算所述第一文本向量和第二文本向量的相似度;当所述第一文本向量和第二文本向量的相似度大于相似阈值时,则根据最长公共子序列识别第一语音文本和第二语音文本,输出最长文本。本申请通过对语音数据转换后的语音文本计算相似度,当语音文本相似则进行最长公共子序列识别输出最长文本,提高语音文本的可读性。

【技术实现步骤摘要】

本专利技术涉及语音识别领域,尤其涉及一种对语音文本转换处理方法、装置、系统及介质


技术介绍

1、在电话销售场景中,每天都会有大量的对话数据接入,坐席与客户之间的交流会通过语音转义成文字的对话保存到数据库中。但在实际场景中,语音转为文本因为延时问题,会导致一篇对话的文本中会出现重复的词语,影响了文本信息的可读性。


技术实现思路

1、鉴于上述现有技术的不足,本专利技术的目的在于提供可应用于语音识别或其它相关领域的一种语音文本转换处理的方法、装置、系统及介质,旨在实现在语音转换成文本时,对文本进行处理,增加文本信息的可读性。

2、本专利技术的技术方案如下:

3、一种语音文本转换处理的方法,所述方法包括:

4、获取第一语音数据和第二语音数据;

5、将所述第一语音数据和第二语音数据转换成第一语音文本和第二语音文本;

6、将第一语音文本和第二语音文本转换为第一文本向量和第二文本向量;

7、计算所述第一文本向量和第二文本向量的相似度;

8、当所述第一文本向量和第二文本向量的相似度大于相似阈值时,则根据最长公共子序列识别第一语音文本和第二语音文本,输出最长文本。

9、在一个实施例中,所述获取第一语音数据和第二语音数据之后,包括:

10、对所述第一语音数据和第二语音数据进行预处理,得到处理后的第一语音数据和第二语音数据。

11、在一个实施例中,所述将所述第一语音数据和第二语音数据转换成第一语音文本和第二语音文本之后,包括:

12、对所述第一语音文本和第二语音文本进行预处理,得到第一语义文本和第二语义文本。

13、在一个实施例中,所述将第一语音文本和第二语音文本转换为第一文本向量和第二文本向量,包括:

14、将所述第一语义文本和第二语义文本分别进行分割,获得第一分割文本和第二分割文本;

15、采用算法将所述第一分割文本和第二分割文本转换为第一文本向量和第二文本向量。

16、在一个实施例中,所述计算所述第一文本向量和第二文本向量的相似度,包括:

17、根据所述第一文本向量和第二文本向量计算第一文本向量与第二文本向量的向量点积;

18、根据所述第一文本向量和第二文本向量计算第一文本范数和第二文本范数;

19、根据所述向量点积、第一文本范数和第二文本范数计算相似度。

20、在一个实施例中,所述计算所述第一文本向量和第二文本向量的相似度,还包括:

21、当所述第一文本向量和第二文本向量的相似度小于相似阈值时,则输出第一语音文本和第二语音文本。

22、在一个实施例中,所述根据最长公共子序列识别第一语音文本和第二语音文本,输出最长文本,包括:

23、将所述第一语义文本和第二语义文本分解为第一语义列表和第二语义列表;

24、根据所述第一语义列表和第二语义列表构建最长语义文本;

25、对所述构建的最长语义文本进行纠错处理,输出最长文本。

26、一种语音文本转换处理装置,包括:

27、语音获取模块,用于获取第一语音数据和第二语音数据;

28、文本转换模块,用于将所述第一语音数据和第二语音数据转换成第一语音文本和第二语音文本;

29、向量转换模块,用于将第一语音文本和第二语音文本转换为第一文本向量和第二文本向量;

30、相似度计算模块,用于计算所述第一文本向量和第二文本向量的相似度;

31、文本输出模块,用于当所述第一文本向量和第二文本向量的相似度大于相似阈值时,则根据最长公共子序列识别第一语音文本和第二语音文本,输出最长文本。

32、一种语音文本转换处理系统,所述系统包括至少一个处理器;以及,

33、与所述至少一个处理器通信连接的存储器;其中,

34、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述语音文本转换处理的方法。

35、一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行上述的语音文本转换处理的方法。

36、有益效果:本专利技术公开了语音文本转换处理的方法、装置、系统及介质,相比于现有技术,本申请通过对语音数据转换后的语音文本计算相似度,当语音文本相似则进行最长公共子序列识别输出最长文本,提高语音文本的可读性。

本文档来自技高网...

【技术保护点】

1.一种语音文本转换处理的方法,其特征在于,包括:

2.根据权利要求1所述的语音文本转换处理的方法,其特征在于,所述获取第一语音数据和第二语音数据之后,包括:

3.根据权利要求1所述的语音文本转换处理的方法,其特征在于,所述将所述第一语音数据和第二语音数据转换成第一语音文本和第二语音文本之后,包括:

4.根据权利要求3所述的语音文本转换处理的方法,其特征在于,所述将第一语音文本和第二语音文本转换为第一文本向量和第二文本向量,包括:

5.根据权利要求1所述的语音文本转换处理的方法,其特征在于,所述计算所述第一文本向量和第二文本向量的相似度,包括:

6.根据权利要求1所述的语音文本转换处理的方法,其特征在于,所述计算所述第一文本向量和第二文本向量的相似度,还包括:

7.根据权利要求3所述的语音文本转换处理的方法,其特征在于,所述根据最长公共子序列识别第一语音文本和第二语音文本,输出最长文本,包括:

8.一种语音文本转换处理装置,其特征在于,包括:

9.一种语音文本转换处理系统,其特征在于,所述系统包括至少一个处理器;以及,

10.一种非易失性计算机可读存储介质,其特征在于,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行权利要求1-7任一项所述的语音文本转换处理的方法。

...

【技术特征摘要】

1.一种语音文本转换处理的方法,其特征在于,包括:

2.根据权利要求1所述的语音文本转换处理的方法,其特征在于,所述获取第一语音数据和第二语音数据之后,包括:

3.根据权利要求1所述的语音文本转换处理的方法,其特征在于,所述将所述第一语音数据和第二语音数据转换成第一语音文本和第二语音文本之后,包括:

4.根据权利要求3所述的语音文本转换处理的方法,其特征在于,所述将第一语音文本和第二语音文本转换为第一文本向量和第二文本向量,包括:

5.根据权利要求1所述的语音文本转换处理的方法,其特征在于,所述计算所述第一文本向量和第二文本向量的相似度,包括:

6.根据权利要求1所述的...

【专利技术属性】
技术研发人员:袁美璐
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1