【技术实现步骤摘要】
本申请涉及语音信号处理领域,具体涉及一种对话场景下的多层次标注方法及装置。
技术介绍
1、在自然对话环境下,对话策略和行为意图识别是对话系统中的核心任务之一。其中行为意图识别旨在理解用户在对话中的目标或需求,对话策略是指在特定对话情境下,系统如何选择合适的回应方式以达到预期的沟通效果。多轮对话管理涉及如何在连续的对话回合中维持和更新对话状态,以确保系统的回应与用户的意图保持一致。在此过程中还需要利用情感分析来理解用户的情绪状态,并结合个性化学习来预测用户的偏好和行为,这种技术可以帮助系统更好地适应用户的需求和情绪变化。
2、对对话策略和行为意图进行标注,可以帮助训练和改进人工智能系统,在未来的咨询服务中能发挥很大的作用,如自动情感识别、咨询策略建议等,从而提升服务的整体质量和效率。然而,传统方法基本都是单个标注,例如只有说话人标注、文本标注或者只有情感标注。这并不能准确记录心理咨询过程中的完整对话场景,不利于对病患的情感变化以及医生的问询策略进行监测,并且也缺少用于训练和改进人工智能系统的并行标注信息,因此数据的综合利用效率
本文档来自技高网...
【技术保护点】
1.一种对话场景下的多层次标注方法,其特征在于,所述方法包括:
2.根据权利要求1所述的对话场景下的多层次标注方法,其特征在于,所述对对话音频数据进行端点检测,获取仅包含人声的有效语音片段,包括:
3.根据权利要求1所述的对话场景下的多层次标注方法,其特征在于,所述对所述有效语音片段进行特征提取,并对提取到的特征进行聚类分析,获得说话人标签和对应的语音时间段,包括:
4.根据权利要求1所述的对话场景下的多层次标注方法,其特征在于,根据所述语音时间段从所述对话音频数据确定对应的目标语音段,并对所述目标语音段进行文本识别,获得文本数据,
...
【技术特征摘要】
1.一种对话场景下的多层次标注方法,其特征在于,所述方法包括:
2.根据权利要求1所述的对话场景下的多层次标注方法,其特征在于,所述对对话音频数据进行端点检测,获取仅包含人声的有效语音片段,包括:
3.根据权利要求1所述的对话场景下的多层次标注方法,其特征在于,所述对所述有效语音片段进行特征提取,并对提取到的特征进行聚类分析,获得说话人标签和对应的语音时间段,包括:
4.根据权利要求1所述的对话场景下的多层次标注方法,其特征在于,根据所述语音时间段从所述对话音频数据确定对应的目标语音段,并对所述目标语音段进行文本识别,获得文本数据,包括:
5.根据权利要求4所述的对话场景下的多层次标注方法,其特征在于,所述利用预训练的自动语音识别模型对所述梅尔频谱图进行处理,预测获得所述文本数据,包括;
6.根据权利要求1所述的对...
【专利技术属性】
技术研发人员:俞航镔,苏荣锋,王岚,燕楠,
申请(专利权)人:深圳先进技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。