指令生成方法、系统、设备和介质技术方案

技术编号:23558608 阅读:35 留言:0更新日期:2020-03-25 04:06
本发明专利技术涉及自然语言处理和人工智能技术领域,特别涉及指令生成方法、系统、设备和介质。本发明专利技术的方法包括:根据输入信息中的字的上下文信息将字转化为表征向量;将表征向量转化为词槽标签和意图;基于词槽标签和意图,生成指令。与静态的“字到向量”的映射关系相比,相同的字根据该字的上下文信息可以被转化为不同的表征向量,从而提供更加丰富的信息,并且可以再将该表征向量转化为更为准确的词槽标签和意图,从而提高指令生成系统整体的性能。

Instruction generation method, system, equipment and medium

【技术实现步骤摘要】
指令生成方法、系统、设备和介质
本专利技术涉及自然语言处理和人工智能
,特别涉及指令生成方法、系统、设备和介质。
技术介绍
现有的指令生成系统在文字表征阶段,使用一组静态的“字到向量”的映射关系,将输入信息中的字转化为表征向量。该组映射关系是通过随机初始化的或由无监督训练所得到的词嵌入(wordembedding)模型而得到的。在通过由无监督训练所得到的词嵌入模型而得到的映射关系中,语义相近的字会被映射到相近的表征向量。现有方案中所使用的映射关系,即使是通过由无监督训练所得到的词嵌入模型而得到的映射关系,也只能表达字的语义,而不能表达字在输入信息中的上下文信息。也就是说,无论在什么样的输入信息中,相同的字总是被映射到相同的表征向量。这会带来以下两个问题:第一,不同上下文中相同的字可能表达不同的信息,例如对于“手”这个字,其可能表达的是医疗操作,诸如“手术”,也可能表达的是部位,诸如“手部”,如果对这些字使用相同的表征则会造成混淆。因此,在不同的上下文中将相同的字映射到相同的表征向量,会使得后续模型难以区分这些词汇,从而影响本文档来自技高网...

【技术保护点】
1.一种指令生成方法,其特征在于,包括:/n根据输入信息中的字的上下文信息将所述字转化为表征向量;/n将所述表征向量转化为词槽标签和意图;/n基于所述词槽标签和所述意图,生成指令。/n

【技术特征摘要】
1.一种指令生成方法,其特征在于,包括:
根据输入信息中的字的上下文信息将所述字转化为表征向量;
将所述表征向量转化为词槽标签和意图;
基于所述词槽标签和所述意图,生成指令。


2.根据权利要求1所述的方法,其特征在于,通过预训练语言模型来根据所述输入信息中的所述字的所述上下文信息将所述字转化为所述表征向量。


3.根据权利要求2所述的方法,其特征在于,所述预训练语言模型包括以下中的一个:ELMo模型、BERT模型、XLNet模型和GPT模型。


4.根据权利要求2或3所述的方法,其特征在于,所述预训练语言模型的训练样本为未标注的训练样本。


5.根据权利要求1所述的方法,其特征在于,通过语言理解模型来将所述表征向量转化为所述词槽标签和所述意图。


6.一种指令生成系统,其特征在于,包括:
第一转化单元,用于根据输入信息中的字的上下文信息将所述字转化为表征向量;
第二转化单元,用于将所述表征向量转化为词槽标签和意图;...

【专利技术属性】
技术研发人员:郑永升石磊曹越
申请(专利权)人:杭州依图医疗技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1