数据处理方法、装置、电子设备及计算机程序产品制造方法及图纸

技术编号:43783217 阅读:22 留言:0更新日期:2024-12-24 16:18
本发明专利技术公开了一种数据处理方法、装置、电子设备及计算机程序产品。其中,该方法包括:获取待识别的字幕流数据,其中,字幕流数据通过对待识别的语音流数据进行转译得到,字幕流数据包括:多个文本帧,多个文本帧用于构成待识别的自然语言文本;使用预设后端点模型在字幕流数据的多个文本帧中识别后端点,其中,后端点用于表示语义结束的位置,预设后端点模型为预先训练的语义模型,用于识别自然语言文本中的后端点;以后端点为截取文本帧的位置点,在字幕流数据中截取多个文本帧,得到待处理数据;生成待处理数据的答复流数据。本发明专利技术解决了语音对话的答复应速度慢的技术问题。

【技术实现步骤摘要】

本专利技术涉及人工智能领域,具体而言,涉及一种数据处理方法、装置、电子设备及计算机程序产品


技术介绍

1、在大语言模型的出现为传统的自然语言处理(nlp)领域带来了革命性的变革。这些模型,如gpt-3、bert等,通过海量的数据训练,不仅提升了语言理解和生成的准确性,还极大地增强了处理复杂语言任务的能力。它们能够捕捉到语言的深层语义和上下文关系,使得机器能够更加流畅地理解和回应人类的语言。

2、大语言模型使得语音交互系统变得更加智能和自然,能够处理多轮对话,保持对话的连贯性,甚至在一定程度上理解并回应用户的情感。大语言模型的优势还体现在其强大的泛化能力上,它们能够在多种语言任务上表现出色,无需针对每个任务进行大量的定制化训练。这使得大语言模型在搜索引擎优化、内容生成、机器翻译等多个领域都有着广泛的应用前景。

3、传统的语音对话大概分为语音识别(asr)、自然语言理解(nlu)、答案生成(nlg)和语音合成(tts)几大模块。大语言模型的出现使得在传统的语音交互链路中的nlu和nlg变得更加智能。但是同时大语言模型由于规模变大,带来本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在获取待识别的字幕流数据之后,方法还包括:

3.根据权利要求2所述的方法,其特征在于,方法还包括:

4.根据权利要求1所述的方法,其特征在于,获取待识别的字幕流数据包括:

5.根据权利要求1所述的方法,其特征在于,生成所述待处理数据的答复流数据包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7.根据权利要求5所述的方法,其特征在于,在对所述待转译文本数据进行转译,得到所述答复流数据之后,所述方法还包括:

...

【技术特征摘要】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在获取待识别的字幕流数据之后,方法还包括:

3.根据权利要求2所述的方法,其特征在于,方法还包括:

4.根据权利要求1所述的方法,其特征在于,获取待识别的字幕流数据包括:

5.根据权利要求1所述的方法,其特征在于,生成所述待处理数据的答复流数据包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7.根据权利...

【专利技术属性】
技术研发人员:王东航阮宜龙张云龙
申请(专利权)人:中电信人工智能科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1