一种答复内容生成方法、装置、电子设备和可读介质制造方法及图纸

技术编号:40194532 阅读:21 留言:0更新日期:2024-01-26 23:57
本公开的实施例公开了一种答复内容生成方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取用户语音;确定用户语音对应的至少一条答复文本,得到答复文本序列;根据用户语音生成语音向量;根据预先配置的prompt信息和答复文本序列生成文本向量序列;根据语音向量和文本向量序列,生成用户语音对应的答复内容。该实施方式实现了语音识别和自然语言理解的准确性和效率的提高,为用户提供更加便捷和智能的语音交互体验,同时能够缩短流程,加速处理时间,实现机器和人类更流畅的交互。

【技术实现步骤摘要】

本公开的实施例涉及计算机,具体涉及一种答复内容生成方法、装置、电子设备和计算机可读介质。


技术介绍

1、在自然语言处理领域,传统的语音识别和文本生成技术通常需要多个模块的组合,例如语音信号处理、特征提取、声学模型、语言模型等。这些模块需要手动设计和调整,且需要大量的人工标注数据来训练模型。这种方法存在许多问题,例如模块之间的耦合性、数据稀缺性和模型复杂度等。

2、现有模型大都是文字输入,文字输出,在于人类进行对话时,先通过语音识别将语音转换成文字,模型根据文字输出对话的答案,然后通过文字转语音技术播放出来。这种模型一是结构复杂,处理时间长,而是在语音识别的过程中会损失掉人类表述时的情绪信息,一段相同的文字用不同的语气说出来所表达的含义是完全不一样的,因此现有模型在与人类进行沟通时容易出现无法正确理解人类所表达的内容,反应慢的问题。


技术实现思路

1、本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要本文档来自技高网...

【技术保护点】

1.一种答复内容生成方法,包括:

2.根据权利要求1所述的方法,其中,所述根据所述语音向量和所述文本向量序列,生成所述用户语音对应的答复内容,包括:

3.根据权利要求2所述的方法,其中,所述语音解码器由输入层、至少两层卷积层、至少两层池化层、多层激活层和全连接层组成,所述卷积层包括一层由五个卷积核组成的第一卷积层以及由十个卷积核组成的第二卷积层,所述第一卷积层以及第二卷积层与池化层和激活层依次连接。

4.根据权利要求2-3所述的方法,其中,所述语音解码器是根据以下步骤训练得到的:

5.根据权利要求4所述的方法,其中,所述方法还包括:

...

【技术特征摘要】

1.一种答复内容生成方法,包括:

2.根据权利要求1所述的方法,其中,所述根据所述语音向量和所述文本向量序列,生成所述用户语音对应的答复内容,包括:

3.根据权利要求2所述的方法,其中,所述语音解码器由输入层、至少两层卷积层、至少两层池化层、多层激活层和全连接层组成,所述卷积层包括一层由五个卷积核组成的第一卷积层以及由十个卷积核组成的第二卷积层,所述第一卷积层以及第二卷积层与池化层和激活层依次连接。

4.根据权利要求2-3所述的方法,其中,所述语音解码器是根据以...

【专利技术属性】
技术研发人员:马春春方康冯敏闵天磊李国忠
申请(专利权)人:上海强仝智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1