多轮问答系统历史上下文语义表示方法技术方案

技术编号:32363132 阅读:15 留言:0更新日期:2022-02-20 03:33
本发明专利技术提供了一种多轮问答系统历史上下文语义表示方法,其减少了因对话系统上游发生错误对下游结果的影响,包括以下步骤:将语音数据通过ASR模块转化文本数据,同时通过时间序列算法,将处理后的音频数据直接作为DST的特征输入给DST模型;NLU模块数据接收到文本数据后,通过自然语言处理算法处理后,将特征数据传输给ASR模型;利用DST模块将ASR模块输入的音频特征数据和NLU模块输入的文本特征数据融合,结合历史上下文信息进行信息的存储追踪。踪。踪。

【技术实现步骤摘要】
多轮问答系统历史上下文语义表示方法


[0001]本专利技术涉及一种多轮问答系统历史上下文语义表示方法,属于智能问答


技术介绍

[0002]多轮问答系统中,DST模块上接语音识别模块,下接对话策略优化(DPL)模块。是存储历史上下文信息的重要模块。也是做好智能对话系统的关键。
[0003]现有的DST模块上级主要接受来自NLU的数据。NLU数据主要来自于ASR模块的语音转文本。该模型的主要缺点在于,当ASR或NLU模块的数据出现错误,错误会传到到DST模块。

技术实现思路

[0004]本专利技术目的是提供了一种多轮问答系统历史上下文语义表示方法,减少了因对话系统上游发生错误对下游结果的影响,提高对话系统回复生成的质量。
[0005]本专利技术为实现上述目的,通过以下技术方案实现:
[0006]一种多轮问答系统历史上下文语义表示方法,包括以下步骤:
[0007]S1.将语音数据通过ASR模块转化文本数据,同时通过时间序列算法,将处理后的音频数据直接作为DST的特征输入给DST模型;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多轮问答系统历史上下文语义表示方法,其特征在于,包括以下步骤:S1.将语音数据通过ASR模块转化文本数据,同时通过时间序列算法,将处理后的音频数据直接作为DST的特征输入给DST模型;S2.NLU模块数据接收到文本数据后,通过自然语言处理算法处理后,将特征数据传输给ASR模型;S3.利用DST模块将ASR模块输入的音频特征数据和NLU模块输入的文本特征数据融合,结合历史上下文信息进行信息的存储追踪。2.根据权利要求1所述多轮问答系统历史上下文语义表示方法,其特征在于:ASR模块通过降噪处理、回声消除及VAD等算法处理,将音频数据转化为文本。3.根据权利要求1所述多轮问答系统历史上下文语义表示方法,其特征在于:步骤S2中自然语言处理算法包括:分词服务、特征化操作、实体抽取及分类算法。4.根据权利要求3所述多轮问答系统历史上下文语义表示方法,其特征在于:实体抽取及分类算法采用transformer+CRF结构进行操作,具体过程如...

【专利技术属性】
技术研发人员:冯卫森冯落落李沛李晓瑜高明王建华尹青山
申请(专利权)人:山东新一代信息产业技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1