The present invention relates to the field of language processing, and proposes a method of cross-language transfer of spoken language understanding in a dialogue system, aiming at solving the technical problems of poor quality of transfer results caused by difficult transfer of semantic tags and language and culture differences in the cross-language transfer of spoken language understanding in a dialogue system. To this end, the cross-language transfer method of spoken language in the present invention includes: acquiring tagged spoken language understanding data to be transferred; using the pre-constructed model of spoken language understanding transfer to transfer the tagged data to obtain the first migration result with category markers; and cultural transfer to the first migration result to obtain the spoken language understanding data of the target language. Based on the above steps, the invention can quickly and accurately transfer oral comprehension data across languages, improve the problem of poor effect of supervised training method caused by insufficient bilingual tagged data, and reduce the cost of data collection and annotation in model training.
【技术实现步骤摘要】
对话系统中口语理解的跨语言迁移方法
本专利技术涉及人机对话
,具体涉及一种在低资源情况下对话系统中口语理解的跨语言迁移方法。
技术介绍
任务型对话系统是在某一特定领域(餐馆、酒店或机票等领域),通过自然语言交互的形式,辅助用户完成任务的人机交互系统。任务型对话系统需要具有如下四个基本功能:口语理解、对话状态跟踪、对话策略和对话生成。其中,口语理解(SpokenLanguageUnderstanding,SLU)作为整个系统的入口,是非常重要的技术模块,在人机交互的对话系统限定的语境中理解话语的含义;它通常包括领域分类、用户意图检测和语义槽填充三个子任务,也有一些系统把领域分类和意图检测合并处理。如果期望让对话系统能针对不同市场支持不同语言,则需要为SLU针对每一种语言都收集并标注大量的训练数据,这非常的耗时耗力。因此,将单语言SLU系统迁移到其他语言,具有很高的应用价值。目前,针对SLU跨语言迁移的方法主要有源端测试法和目标端训练法。源端测试是指将其他语言的用户输入翻译成源语言,然后利用源语言的SLU系统对该输入进行处理。目标端训练是指把源语言的训练语料迁移到目标语言端,再训练目标语言的SLU系统。源端测试的方法简便易行,但是它输出的语义槽结果是源语言的,需要再翻译回目标语言才能被目标语言对话系统中的后续模块使用。而目标端训练的方案则支持直接在目标语言端直接对模型进行训练和调节,更加灵活,且不需要在系统上线后对用户每一个输入都耗费额外的时间进行翻译。然而每一条SLU训练语料都由一条口语文本以及它的语义标注信息组成,例如:“播放专辑<al ...
【技术保护点】
1.一种对话系统中口语理解的跨语言迁移方法,其特征在于,所述方法包括:获取待迁移的源语言口语理解数据;利用预先构建的口语理解迁移模型对所述待迁移数据进行迁移,得到第一迁移结果;对所述第一迁移结果进行文化迁移,得到目标语言的口语理解数据;其中,构建所述口语理解迁移模型包括以下步骤:利用预设的通用平行语料训练通用机器翻译模型,得到第一优化翻译模型;标注所述平行语料中的双语平行口语理解语料,将所标注的双语口语理解语料中的语义槽替换为类别标记,将替换后的双语口语理解语料作为双语类别标记语料;利用所述双语类别标记语料对所述第一优化翻译模型进行有监督的增量训练,得到第二优化翻译模型;使用带类别标记的待迁移数据,对所述第二优化翻译模型进行源端监督的强化翻译增量训练,得到口语理解迁移模型;所述带类别标记的待迁移数据为对所述源语言口语理解数据的语义槽替换为类别标记后得到的数据。
【技术特征摘要】
1.一种对话系统中口语理解的跨语言迁移方法,其特征在于,所述方法包括:获取待迁移的源语言口语理解数据;利用预先构建的口语理解迁移模型对所述待迁移数据进行迁移,得到第一迁移结果;对所述第一迁移结果进行文化迁移,得到目标语言的口语理解数据;其中,构建所述口语理解迁移模型包括以下步骤:利用预设的通用平行语料训练通用机器翻译模型,得到第一优化翻译模型;标注所述平行语料中的双语平行口语理解语料,将所标注的双语口语理解语料中的语义槽替换为类别标记,将替换后的双语口语理解语料作为双语类别标记语料;利用所述双语类别标记语料对所述第一优化翻译模型进行有监督的增量训练,得到第二优化翻译模型;使用带类别标记的待迁移数据,对所述第二优化翻译模型进行源端监督的强化翻译增量训练,得到口语理解迁移模型;所述带类别标记的待迁移数据为对所述源语言口语理解数据的语义槽替换为类别标记后得到的数据。2.根据权利要求1所述的对话系统中口语理解的跨语言迁移方法,其特征在于,所述语义槽包括语义标签和语义槽值,以及“将所标注的双语口语理解语料中的语义槽替换为类别标记”的步骤包括:将所标注的所述双语口语理解语料中的语义标签和语义槽值,替换成指定的类别标记。3.根据权利要求1所述的对话系统中口语理解的跨语言迁移方法,其特征在于,“利用带类别标记的待迁移数据,对所述第二优化翻译模型进行源端监督的强化翻译增量训练,得到口语理解迁移模型”的步骤包括:将所述带类别标记的待迁移数据的单语数据进行输入,获得所述第二优化翻译模型softmax层的输出,得到维度为词表大小的概率分布;根据所述概率分布进行采样,得到采样句;按照所述概率分布进行局部最优解码,得到解码句;分别计算所述采样句和所述解码句的语义槽保留率,作为训练所述第二优化翻译模型的奖励项和奖励正则项;将所述采样句作为标签,利用策略梯度法优化所述第二优化翻译模型的参数。4.根据权利要求3所述的对话系统中口语理解的跨语言迁移方法,其特征在于,“分别计算所述采样句和所述解码句的语义槽保留率”的步骤包括:根据所述解码句中语义槽的漏翻信息、错翻信息,利用如下公式计算所述采样句...
【专利技术属性】
技术研发人员:周玉,白赫,张家俊,宗成庆,赵亮,
申请(专利权)人:中国科学院自动化研究所,出门问问信息科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。