话务文本的语义信息确定方法、装置、电子设备及介质制造方法及图纸

技术编号:40316897 阅读:24 留言:0更新日期:2024-02-07 20:59
本公开提供了一种话务文本的语义信息确定方法、装置、电子设备及介质,涉及人工智能技术领域。该方法包括:在远程通话服务中采集实时语音流,将实时语音流转写为连续的n句文本内容,n为大于1的整数;针对n句文本内容中的任意第i句文本内容,i=1,2,…,n‑1,利用预先训练的断句检测模型,检测第i句文本内容相较于第i+1句文本内容是否为断句,如果否,将该第i句文本内容与第i+1句文本内容进行拼接,将拼接后的文本内容作为更新后的第i+1句文本内容,并针对更新后的第i+1句文本内容返回利用断句检测模型进行断句检测的操作;在n句文本内容均拼接完成后得到m句文本内容,m为小于n的正整数,根据m句文本内容,确定语音流蕴含的语义信息。

【技术实现步骤摘要】

本公开涉及人工智能,具体涉及一种话务文本的语义信息确定方法、装置、电子设备、介质和程序产品。


技术介绍

1、目前,我国商业银行、运营商等已建立较为完成的远程电话服务(如银行的客户之声、远程银行热线等)。在服务过程中,为了保证服务质量,可能会将通过内容进行录音,将录音的内容进行实时转写、离线转写质检等应用。

2、而实际上,在将语音流进行转写的过程中,转写算法通常以固定的“非活性”语音作为断句一句进行切分,从而将连续采集的语音流切分为多句,而固定的切分会将某个角色的一句话切分为两句以上(一般因为停顿、语气、思考等)。而断句后的文本,相较于完整的一句话语义信息有所损失,不能充分挖掘其中蕴含的语义信息。


技术实现思路

1、鉴于上述问题,本公开提供了一种话务文本的语义信息确定方法、装置、电子设备、介质和程序产品。

2、根据本公开的第一个方面,提供了一种话务文本的语义信息确定方法,包括:在远程通话服务中采集实时语音流,将实时语音流转写为连续的n句文本内容,n为大于1的整数;针对n句文本内容中的任意本文档来自技高网...

【技术保护点】

1.一种话务文本的语义信息确定方法,包括:

2.根据权利要求1所述的方法,其中,所述在远程通话服务中采集实时语音流,还包括:

3.根据权利要求1所述的方法,其中,所述断句检测模型包括词法分析模型和语义分析模型,所述断句检测模型通过以下方式预先训练得到:

4.根据权利要求3所述的方法,其中,所述将所述历史语音流转写为连续的多句文本内容之后,还包括:

5.根据权利要求3所述的方法,其中,所述使用所述训练数据集,分别对所述词法分析模型和语义分析模型进行训练,得到训练好的词法分析模型和语义分析模型,包括:

6.根据权利要求5所述的方法,...

【技术特征摘要】

1.一种话务文本的语义信息确定方法,包括:

2.根据权利要求1所述的方法,其中,所述在远程通话服务中采集实时语音流,还包括:

3.根据权利要求1所述的方法,其中,所述断句检测模型包括词法分析模型和语义分析模型,所述断句检测模型通过以下方式预先训练得到:

4.根据权利要求3所述的方法,其中,所述将所述历史语音流转写为连续的多句文本内容之后,还包括:

5.根据权利要求3所述的方法,其中,所述使用所述训练数据集,分别对所述词法分析模型和语义分析模型进行训练,得到训练好的词法分析模型和语义分析模型,包括:

6.根据权利要求5所述的方法,其中,所述对所述词法分析模型和语义...

【专利技术属性】
技术研发人员:刘涛
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1