对话场景下的多层次标注方法及装置制造方法及图纸

技术编号:45165737 阅读:20 留言:0更新日期:2025-05-06 18:24
本申请涉及语音信号处理领域,公开了一种对话场景下的多层次标注方法及装置。通过对对话音频数据进行端点检测以及自动语音识别方法,可以去除真实语音中的噪声以及静音,获取有效语音片段。基于有效语音片段进行聚类分析,获取对应说话人的目标语音段和文本数据,并通过多模态情感分析进行情感特征提取。最后利用大语言模型实现对应说话人的问询策略或意图理解的自动标注。本申请能够对记录的对话语音进行多层次标注为对话场景提供一种高效、准确的信息管理和分析工具,可以极大地提高对话记录的整理效率。这些标注信息可以用于训练和改进人工智能系统,使其在未来的心理咨询服务中发挥更大的作用,从而提升心理健康服务的整体质量和效率。

【技术实现步骤摘要】

本申请涉及语音信号处理领域,具体涉及一种对话场景下的多层次标注方法及装置


技术介绍

1、在自然对话环境下,对话策略和行为意图识别是对话系统中的核心任务之一。其中行为意图识别旨在理解用户在对话中的目标或需求,对话策略是指在特定对话情境下,系统如何选择合适的回应方式以达到预期的沟通效果。多轮对话管理涉及如何在连续的对话回合中维持和更新对话状态,以确保系统的回应与用户的意图保持一致。在此过程中还需要利用情感分析来理解用户的情绪状态,并结合个性化学习来预测用户的偏好和行为,这种技术可以帮助系统更好地适应用户的需求和情绪变化。

2、对对话策略和行为意图进行标注,可以帮助训练和改进人工智能系统,在未来的咨询服务中能发挥很大的作用,如自动情感识别、咨询策略建议等,从而提升服务的整体质量和效率。然而,传统方法基本都是单个标注,例如只有说话人标注、文本标注或者只有情感标注。这并不能准确记录心理咨询过程中的完整对话场景,不利于对病患的情感变化以及医生的问询策略进行监测,并且也缺少用于训练和改进人工智能系统的并行标注信息,因此数据的综合利用效率较低。

本文档来自技高网...

【技术保护点】

1.一种对话场景下的多层次标注方法,其特征在于,所述方法包括:

2.根据权利要求1所述的对话场景下的多层次标注方法,其特征在于,所述对对话音频数据进行端点检测,获取仅包含人声的有效语音片段,包括:

3.根据权利要求1所述的对话场景下的多层次标注方法,其特征在于,所述对所述有效语音片段进行特征提取,并对提取到的特征进行聚类分析,获得说话人标签和对应的语音时间段,包括:

4.根据权利要求1所述的对话场景下的多层次标注方法,其特征在于,根据所述语音时间段从所述对话音频数据确定对应的目标语音段,并对所述目标语音段进行文本识别,获得文本数据,包括:

...

【技术特征摘要】

1.一种对话场景下的多层次标注方法,其特征在于,所述方法包括:

2.根据权利要求1所述的对话场景下的多层次标注方法,其特征在于,所述对对话音频数据进行端点检测,获取仅包含人声的有效语音片段,包括:

3.根据权利要求1所述的对话场景下的多层次标注方法,其特征在于,所述对所述有效语音片段进行特征提取,并对提取到的特征进行聚类分析,获得说话人标签和对应的语音时间段,包括:

4.根据权利要求1所述的对话场景下的多层次标注方法,其特征在于,根据所述语音时间段从所述对话音频数据确定对应的目标语音段,并对所述目标语音段进行文本识别,获得文本数据,包括:

5.根据权利要求4所述的对话场景下的多层次标注方法,其特征在于,所述利用预训练的自动语音识别模型对所述梅尔频谱图进行处理,预测获得所述文本数据,包括;

6.根据权利要求1所述的对...

【专利技术属性】
技术研发人员:俞航镔苏荣锋王岚燕楠
申请(专利权)人:深圳先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1