用于多视图会话查询产生的方法与装置制造方法及图纸

技术编号:43421777 阅读:22 留言:0更新日期:2024-11-22 17:54
一种训练用于查询生成的模型的方法,该方法由至少一个处理器执行并且包括接收与对话历史对应的训练实例查询。该方法还包括基于训练实例查询与对话历史之间的共同词的数目生成该模型的第一静态视图。该方法还包括基于未被对话历史覆盖的一个或更多个词元生成该模型的第二静态视图,所述一个或更多个词元与一个或更多个查询词对应。该方法还包括基于将从该模型生成的候选查询与目标查询进行比较的评分操作生成该模型的动态视图。该方法还包括至少基于第一静态视图、第二静态视图和动态视图训练模型。

【技术实现步骤摘要】
【国外来华专利技术】

本公开内容总体上涉及查询生成,并且更特别地,涉及用于多视图会话查询产生的方法和装置。


技术介绍

1、会话查询生成旨在从对话历史产生搜索查询,以反映下一对话主题,其中,查询通常用于从知识源(例如,搜索引擎)中检索相关知识,以帮助基于知识的对话系统。利用外部知识已经被证明对于对话响应生成是重要的。遵循该研究方向,探索作为外部知识的互联网因其不断更新的内容和对各种领域的覆盖而正在越来越受欢迎。为了从网络检索有用的知识,提出了查询产生的任务以从对话上下文收集搜索查询,以用于与搜索引擎有效地进行交互。因为生成的查询的质量直接影响检索到的知识与当前对话上下文的关联性,因此该项任务至关重要。

2、当前的努力将查询产生视为典型的文本到文本生成问题,并且采用transformer架构作为构建查询生成器的主干。作为惯例,可以采用预训练的编码器-解码器模型,例如bart[2]或t5[3],并且对具有标准交叉熵(cross entropy,ce)损失的带注释的查询生成数据集进行进一步微调。

3、为了完美生成黄金查询,先前的模型面临忠实性(例如,准确性)和数本文档来自技高网...

【技术保护点】

1.一种训练用于查询生成的模型的方法,所述方法由至少一个处理器执行并且包括:

2.根据权利要求1所述的方法,其中,生成所述第一静态视图包括:

3.根据权利要求2所述的方法,其中,所述缩放值是基于下述确定的0-1缩放值:(i)提供所述训练实例查询与所述对话历史之间的相似性的测量的忠实度;以及(ii)指示所述忠实度的使得不对所述缩放值施加惩罚的最小值的参数。

4.根据权利要求1所述的方法,其中,生成所述第一静态视图包括确定用于预测所述第一静态视图的损失运算,其中,所述模型基于用于预测所述第一静态视图的损失运算来训练。

5.根据权利要求1所述的方...

【技术特征摘要】
【国外来华专利技术】

1.一种训练用于查询生成的模型的方法,所述方法由至少一个处理器执行并且包括:

2.根据权利要求1所述的方法,其中,生成所述第一静态视图包括:

3.根据权利要求2所述的方法,其中,所述缩放值是基于下述确定的0-1缩放值:(i)提供所述训练实例查询与所述对话历史之间的相似性的测量的忠实度;以及(ii)指示所述忠实度的使得不对所述缩放值施加惩罚的最小值的参数。

4.根据权利要求1所述的方法,其中,生成所述第一静态视图包括确定用于预测所述第一静态视图的损失运算,其中,所述模型基于用于预测所述第一静态视图的损失运算来训练。

5.根据权利要求1所述的方法,其中,生成所述第二静态视图包括通过将未被所述对话历史覆盖的词元转换为预定义的掩码词元来生成模板,其中,所述模板与所述训练实例查询进行连结以生成连结序列。

6.根据权利要求5所述的方法,其中,生成所述第二静态视图还包括基于生成的所述模板确定用于预测所述第二静态视图的损失运算,其中,所述模型基于用于预测所述第二静态视图的损失运算来训练。

7.根据权利要求1所述的方法,其中,所述评分操作是unigram f1操作。

8.根据权利要求1所述的方法,其中,生成所述动态视图还包括至少基于所述评分操作和所述候选查询确定用于预测所述动态视图的损失运算。

9.一种用于训练用于查询生成的模型的设备,所述设备包括:

10.根据权利要求9所述的设备,其中,第一生成代码还包括:

11.根据权利要求10所述的设备,其中,所述缩放值是基于下述确定的0-1缩放值:(i)提供所述训练实例查询与所述对话历史之间的相似性的测量的忠实度;以及(ii)指示所述忠实度的使得不对所述缩放值施加惩罚的最小值的参数。

12.根据权利要求9所述的设备,其中,所述第一生成代码还包括确定代码,所述确定代码被配置成使所述至少...

【专利技术属性】
技术研发人员:宋林峰
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1