【技术实现步骤摘要】
产生一对话状态追踪模型的装置及方法
[0001]本专利技术系关于一种产生一对话状态追踪模型的装置及方法。具体而言,本专利技术系关于一种基于对话记录产生一对话状态追踪模型的装置及方法。
技术介绍
[0002]目前已有许多企业导入以人工智能(Artificial Intelligence;AI)为基础的对话式服务,例如:采用对话机器人提供客户服务。这类对话式服务涉及自然语言理解、对话管理及自然语言生成等三个面向的技术。对话管理技术中的对话状态追踪系用以判读对话中的关键资讯,为对话式服务能否正确地达成任务(例如:协助使用者办理车祸理赔、协助使用者购票)的重要关键。
[0003]某些习知的对话管理技术为规则式的。概要而言,这类技术先对使用者所输入/所说出的句子进行语意理解,再基于语意理解的结果以预定的规则回复。这类技术极度仰赖语意理解的准确度,若未能准确地理解使用者所输入/所说出的句子的语意,则基于预定规则所决定出来的回复也会不准确。此外,由于这类技术受限于预定的规则,因此缺乏弹性。基于前述各种缺点,采用这类技术,一旦发生误判,往往会导致连续的错误,而无法完成任务。
[0004]目前已有一些学习式的对话管理技术,其系利用特征来训练神经网络模型,再以经过训练的神经网络模型作为对话状态追踪模型。然而,这类技术能否准确地进行对话状态追踪,进而完成任务,取决于训练神经网络模型时所使用的特征,以及如何以这些特征训练神经网络模型。尽管学习式的对话管理技术优于规则式的对话管理技术,但相较于由人类直接提供服务,仍有相当大的改 ...
【技术保护点】
【技术特征摘要】
1.一种产生一对话状态追踪模型的装置,其特征在于,包含:一储存器,储存一数据库;以及一处理器,电性连接至该储存器,根据一询问消息所对应的一询问栏位自该数据库撷取该询问栏位所对应的一第一栏位特征量,自该数据库撷取该询问栏位所对应的至少一第一候选词各自对应的一第一候选词特征量,且将该至少一第一候选词特征量整合为一第一整合特征量,其中,该处理器还产生与该询问消息对应的一回复消息的至少一关联子句,根据该至少一关联子句产生一语句关联特征量,根据该第一栏位特征量、该第一整合特征量及该语句关联特征量产生一询问栏位相关特征,且根据该询问栏位相关特征训练该对话状态追踪模型。2.如权利要求1所述的装置,其特征在于,该处理器还将该第一栏位特征量及该第一整合特征量整合为一第一输出特征量,将该第一输出特征量输入一第一神经网络模型以产生一第二输出特征量,将该第二输出特征量及该语句关联特征量整合为一第三输出特征量,且将该第三输出特征量输入一第二神经网络模型以产生该询问栏位相关特征。3.如权利要求1所述的装置,其特征在于,该处理器还根据该询问消息所对应的一栏位回复自该数据库撷取该栏位回复所对应的一第一回复特征量,自该数据库撷取该栏位回复所对应的至少一第二候选词各自对应的一第二候选词特征量,且将该至少一第二候选词特征量整合为一第二整合特征量,其中该处理器系根据该第一栏位特征量、该第一回复特征量、该第一整合特征量、该第二整合特征量及该语句关联特征量产生该询问栏位相关特征。4.如权利要求3所述的装置,其特征在于,该处理器还将该第一栏位特征量及该第一整合特征量整合为一第一输出特征量,将该第一回复特征量及该第二整合特征量整合为一第二输出特征量,将该第一输出特征量、该第二输出特征量及该语句关联特征量输入一神经网络模型以产生该询问栏位相关特征。5.如权利要求1所述的装置,其特征在于,该处理器还根据该回复消息及多个预设栏位自该数据库撷取至少一第二候选词各自对应的一第二候选词特征量,将该至少一第二候选词特征量整合为一第二整合特征量,且根据该语句关联特征量及该第二整合特征量产生一进阶关联特征,其中该处理器系根据该询问栏位相关特征及该进阶关联特征训练该对话状态追踪模型。6.如权利要求5所述的装置,其特征在于,该处理器还将该语句关联特征量及该第二整合特征量整合为一输出特征量,且将该输出特征量输入一神经网络模型以产生该进阶关联特征。7.如权利要求1所述的装置,其特征在于,该处理器还对该回复消息进行自然语言理解(Natural Language Understanding;NLU)分析以得一语意理解栏位及一语意理解回复,自该数据库撷取该语意理解栏位所对应的一第二栏位特征量,自该数据库撷取该语意理解栏位所对应的至少一第二候选词各自对应的一第二候选词特征量,且将该至少一第二候选词特征量整合为一第二整合特征量,其中,该处理器还自该数据库撷取该语意理解回复所对应的一回复特征量,自该数据库撷取该语意理解回复所对应的至少一第三候选词各自对应的一第三候选词特征量,且将该至少一第三候选词特征量整合为一第三整合特征量,
其中,该处理器还根据该第二栏位特征量、该第二整合特征量、该回复特征量及该第三整合特征量产生一语意理解特征,其中,该处理器系根据该询问栏位相关特征及该语意理解特征训练该对话状态追踪模型。8.如权利要求7所述的装置,其特征在于,该处理器还将该第二栏位特征量及该第二整合特征量整合为一第一输出特征量,将该回复特征量及该第三整合特征量整合为一第二输出特征量,将该第一输出特征量及该第二输出特征量整合为一第三输出特征量,且将该第三输出特征量输入一神经网络模型以产生该语意理解特征。9.如权利要求1所述的装置,其特征在于,该处理器还根据该回复消息及多个预设栏位自该数据库撷取至少一第二候选词各自对应的一第二候选词特征量,将该至少一第二候选词特征量整合为一第二整合特征量,且根据该语句关联特征量及该第二整合特征量产生一进阶关联特征,其中,该处理器还对该回复消息进行自然语言理解分析以得一语意理解栏位及一语意理解回复,自该数据库撷取该语意理解栏位所对应的一第二栏位特征量,自该数据库撷取该语意理解栏位所对应的至少一第三候选词各自对应的一第三候选词特征量,且将该至少一第三候选词特征量整合为一第三整合特征量,其中,该处理器还自该数据库撷取该语意理解回复所对应的一回复特征量,自该数据库撷取该语意理解回复所对应的至少一第四候选词各自对应的一第四候选词特征量,将该至少一第四候选词特征量整合为一第四整合特征量,且根据该第二栏位特征量、该第三整合特征量、该回复特征量及该第四整合特征量产生一语意理解特征,其中,该处理器系根据该询问栏位相关特征、该进阶关联特征及该语意理解特征训练该对话状态追踪模型。10.如权利要求3所述的装置,其特征在于,该处理器还根据该回复消息及多个预设栏位自该数据库撷取至少一第三候选词各自对应的一第三候选词特征量,将该至少一第三候选词特征量整合为一第三整合特征量,且根据该语句关联特征量及该第三整合特征量产生一进阶关联特征,其中,该处理器还对该回复消息进行自然语言理解分析以得一语意理解栏位及一语意理解回复,自该数据库撷取该语意理解栏位所对应的一第二栏位特征量,自该数据库撷取该语意理解栏位所对应的至少一第四候选词各自对应的一第四候选词特征量,且将该至少一第四候选词特征量整合为一第四整合特征量,其中,该处理器还自该数据库撷取该语意理解回复所对应的一第二回复特征量,自该数据库撷取该语意理解回复所对应的至少一第五候选词各自对应的一第五候选词特征量,将该至少一第五候选词特征量整合为一第五整合特征量,且根据该第二栏位特征量、该第四整合特征量、该第二回复特征量及该第五整合特征量产生一语意理解特征,其中,该处理器系根据该询问栏位相关特征、该进阶关联特征及该语意理解特征训练该对话状态追踪模型。11.一种产生一对话状态追踪模...
【专利技术属性】
技术研发人员:杨伟桢,邱冠龙,邱育贤,
申请(专利权)人:财团法人资讯工业策进会,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。