一种生成模型的训练方法及推荐理由的生成方法和装置制造方法及图纸

技术编号:30963446 阅读:10 留言:0更新日期:2021-11-25 20:28
本发明专利技术实施例提供了一种生成模型的训练方法及推荐理由的生成方法和装置,其中,所述训练方法包括:根据训练样本数据对生成器网络模型、第一判别器网络模型和第二判别器网络模型进行训练,直至满足收敛条件。第一判别器网络模型用于判断生成器网络模型输出的推荐理由是否属于评论标注文本;第二判别器用于判断生成器网络模型输出的推荐理由是否属于标签点击特征。本发明专利技术实施例将用户特征作为训练样本数据,即生成模型的训练过程引入了标签点击特征。并通过第二判别器网络模型判断生成器网络模型输出的推荐理由是否属于标签点击特征,通过标签点击特征指导生成模型的训练,以便生成模型可以生成高点击率的推荐理由。成模型可以生成高点击率的推荐理由。成模型可以生成高点击率的推荐理由。

【技术实现步骤摘要】
一种生成模型的训练方法及推荐理由的生成方法和装置


[0001]本专利技术涉及互联网
,特别是涉及一种推荐理由的生成模型的训练方法和装置,以及一种推荐理由的生成方法和装置。

技术介绍

[0002]推荐理由对帮助用户快速了解商户特色,辅助用户进行到访决策,促进用户内容消费都起到了巨大作用。目前,推荐理由已赋能搜索、推荐等多个板块,为点击率、转化率的表现均起到了正向作用。
[0003]相关技术中,商户的推荐理由主要通过以下几种方案得到:
[0004](1)人工撰写的方法:由专业运营人员撰写的专业生产内容(Professionally Generated Content,简称PGC),该方案能确保推荐理由质量高、表达丰富。
[0005](2)评论抽取的方法:从商户的优质用户评论中抽取。该方案能充分利用点评业务的海量用户生产内容(User Generated Content,简称UGC),得到更贴近用户视角、亲切可信的推荐理由。
[0006](3)模板填充的方法:基于专业运营人员设计的模板进行用户、商户信息填充的方式得到,如“来自[城市名]的用户都会喜欢这家收录[X]年的老店”。该方案质量可控,且能展示用户个性化信息,给人惊喜感。
[0007](4)文本生成的方案:以商户信息、用户评论等作为输入,以现有的高质量推荐理由作为样本,通过训练序列到序列(sequence to sequence)模型生成得到推荐理由。
[0008]但是,上述几种方案均存在技术缺陷:
[0009](1)人工撰写的方法:该方案需要消耗大量的时间与人力成本,且无法为不同偏好的用户进行个性化定制地撰写。
[0010](2)评论抽取的方法:该方案很依赖商户优质UGC的数量,对于三线以下城市或新店,很难有足量高质量UGC供抽取。
[0011](3)模板填充的方法:该方案语言形式相对单一。
[0012](4)文本生成的方案:之前文本生成的方案鲜有将用户特征考虑在内,生成目标也往往只考虑了语言模型的指标,而语言模型的好坏与线上指标的表现之间并不能完全等价,且该方案单独使用时,线上生成质量不可控,容易产生坏的案例(bad case)。

技术实现思路

[0013]鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种推荐理由的生成模型的训练方法和装置,以及一种推荐理由的生成方法和装置。
[0014]为了解决上述问题,根据本专利技术实施例的第一方面,公开了一种推荐理由的生成模型的训练方法,包括:获取训练样本数据,所述训练样本数据包含用户特征和POI的评论标注文本,所述用户特征包含标签点击特征;根据所述训练样本数据对生成器网络模型、第
一判别器网络模型和第二判别器网络模型进行训练,直至所述生成器网络模型、所述第一判别器网络模型和所述第二判别器网络模型满足预设的收敛条件;其中,所述第一判别器网络模型用于判断所述生成器网络模型输出的推荐理由是否属于所述评论标注文本;所述第二判别器用于判断所述生成器网络模型输出的推荐理由是否属于所述标签点击特征。
[0015]可选地,所述根据所述训练样本数据对生成器网络模型、第一判别器网络模型和第二判别器网络模型进行训练,包括:将所述训练样本数据输入至所述生成器网络模型;基于所述生成器网络模型对所述训练样本数据进行编码处理和解码处理得到所述推荐理由的各推荐词的概率分布结果;根据所述概率分布结果生成所述推荐理由的各推荐词的词嵌入向量;将各所述推荐词的词嵌入向量和所述用户特征的词嵌入向量输入至所述第一判别器网络模型和所述第二判别器网络模型,以便根据所述推荐词的词嵌入向量和所述评论标注文本对所述第一判别器网络模型进行训练,以及根据所述推荐词的词嵌入向量和所述用户特征的词嵌入向量对所述第二判别器网络模型进行训练。
[0016]可选地,所述基于所述生成器网络模型对所述训练样本数据进行编码处理和解码处理得到所述推荐理由的各推荐词的概率分布结果,包括:基于所述生成器网络模型分别对所述用户特征的词嵌入向量和所述评论标注文本的词嵌入向量进行编码处理得到所述训练样本数据的编码结果;基于所述生成器网络模型对所述编码结果进行解码处理得到所述推荐理由的各推荐词的概率分布结果。
[0017]可选地,所述基于所述生成器网络模型分别对所述用户特征的词嵌入向量和所述评论标注文本的词嵌入向量进行编码处理得到所述训练样本数据的编码结果,包括:基于所述生成器网络模型对所述用户特征的词嵌入向量进行编码处理得到所述用户特征的编码结果;基于所述生成器网络模型对所述评论标注文本的词嵌入向量进行编码处理得到所述评论标注文本的编码结果;将所述用户特征的编码结果和所述评论标注文本的编码结果拼接为所述训练样本数据的编码结果。
[0018]可选地,所述基于所述生成器网络模型对所述编码结果进行解码处理得到所述推荐理由的各推荐词的概率分布结果,包括:基于所述生成器网络模型按照拷贝模式对所述编码结果进行解码处理,得到所述推荐理由的各推荐词的注意力分布结果;根据各所述推荐词的注意力分布结果从所述评论标注文本中提取各评论词,以便将所述推荐理由的各推荐词的数量缩减至与所述评论标注文本的各所述评论词的数量相同;将各所述推荐词的注意力分布结果作为对应的各所述推荐词的概率分布结果。
[0019]可选地,所述根据所述概率分布结果生成所述推荐理由的各推荐词的词嵌入向量,包括:根据各所述推荐词的概率分布结果对各所述评论词的词嵌入向量加权求和,得到各所述推荐词的词嵌入向量。
[0020]可选地,所述根据所述训练样本数据对生成器网络模型、第一判别器网络模型和第二判别器网络模型进行训练,包括:根据所述训练样本数据对所述生成器网络模型和所述第二判别器网络模型进行训练,直至所述生成器网络模型和所述第二判别器网络模型满足所述收敛条件;保持所述生成器网络模型的参数和所述第二判别器网络模型的参数不变,调整所述第一判别器网络模型的参数,保持所述第一判别器网络模型的参数和所述第二判别器网络模型的参数不变,调整所述生成器网络模型的参数,直至所述生成器网络模型和所述第一判别器网络模型满足所述收敛条件。
[0021]根据本专利技术实施例的第二方面,还公开了一种推荐理由的生成方法,包括:获取用户特征,所述用户特征包含标签点击特征;将所述用户特征输入根据如第一方面所述的方法训练得到的生成模型,输出针对所述用户特征的POI推荐理由。
[0022]可选地,所述将所述用户特征输入根据如第一方面所述的方法训练得到的生成模型,输出针对所述用户特征的POI推荐理由,包括:根据所述生成模型的生成器网络模型生成所述POI推荐理由的各推荐词的概率分布结果;对所述概率分布结果进行解码处理得到所述POI推荐理由。
[0023]可选地,所述对所述概率分布结果进行解码处理得到所述POI推荐理由,包括:按照集束搜索解码方式对所述概率分布结果进行解码处理得到局部最优解;将所述局部最优解作为所述POI推荐理由。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种推荐理由的生成模型的训练方法,其特征在于,包括:获取训练样本数据,所述训练样本数据包含用户特征和POI的评论标注文本,所述用户特征包含标签点击特征;根据所述训练样本数据对生成器网络模型、第一判别器网络模型和第二判别器网络模型进行训练,直至所述生成器网络模型、所述第一判别器网络模型和所述第二判别器网络模型满足预设的收敛条件;其中,所述第一判别器网络模型用于判断所述生成器网络模型输出的推荐理由是否属于所述评论标注文本;所述第二判别器用于判断所述生成器网络模型输出的推荐理由是否属于所述标签点击特征。2.根据权利要求1所述的方法,其特征在于,所述根据所述训练样本数据对生成器网络模型、第一判别器网络模型和第二判别器网络模型进行训练,包括:将所述训练样本数据输入至所述生成器网络模型;基于所述生成器网络模型对所述训练样本数据进行编码处理和解码处理得到所述推荐理由的各推荐词的概率分布结果;根据所述概率分布结果生成所述推荐理由的各推荐词的词嵌入向量;将各所述推荐词的词嵌入向量和所述用户特征的词嵌入向量输入至所述第一判别器网络模型和所述第二判别器网络模型,以便根据所述推荐词的词嵌入向量和所述评论标注文本对所述第一判别器网络模型进行训练,以及根据所述推荐词的词嵌入向量和所述用户特征的词嵌入向量对所述第二判别器网络模型进行训练。3.根据权利要求2所述的方法,其特征在于,所述基于所述生成器网络模型对所述训练样本数据进行编码处理和解码处理得到所述推荐理由的各推荐词的概率分布结果,包括:基于所述生成器网络模型分别对所述用户特征的词嵌入向量和所述评论标注文本的词嵌入向量进行编码处理得到所述训练样本数据的编码结果;基于所述生成器网络模型对所述编码结果进行解码处理得到所述推荐理由的各推荐词的概率分布结果。4.根据权利要求3所述的方法,其特征在于,所述基于所述生成器网络模型分别对所述用户特征的词嵌入向量和所述评论标注文本的词嵌入向量进行编码处理得到所述训练样本数据的编码结果,包括:基于所述生成器网络模型对所述用户特征的词嵌入向量进行编码处理得到所述用户特征的编码结果;基于所述生成器网络模型对所述评论标注文本的词嵌入向量进行编码处理得到所述评论标注文本的编码结果;将所述用户特征的编码结果和所述评论标注文本的编码结果拼接为所述训练样本数据的编码结果。5.根据权利要求3所述的方法,其特征在于,所述基于所述生成器网络模型对所述编码结果进行解码处理得到所述推荐理由的各推荐词的概率分布结果,包括:基于所述生成器网络模型按照拷贝模式对所述编码结果进行解码处理,得到所述推荐理由的各推荐词的注意力分布结果;根据各所述推荐词的注意力分布结果从所述评论标注文本中提取各评论词,以便将所
述推荐理由的各推荐词的数量缩减至与所述评论标注文本的各所述评论词的数量相同;将各所述推荐词的注意力分布结果作为对应的各所述推荐词的概率分布结果。6.根据权利要求5所述的方法,其特征在于,所述根据所述概率分布结果生成所述推荐理由的各推荐词的词嵌入向量,包括:根据各所述推荐词的概率分布结果对各所述评论词的词嵌入向量加权求和,得到各所述推荐词的词嵌入向量。7.根据权利要求1所述的方法,其特征在于,所述根据所述训练样本数据对生成器网络模型、第一判别器网络模型和第二判别器网络模型进行训练,包括:根据所述训练样本数据对所述生成器网络模型和所述第二判别器网络模型进行训练,直至所述生成器网络模型和所述第二判别器网络模型满足所述收敛条件;保持所述生成器网络模型的参数和所述第二判别器网络模型的参数不变,调整所述第一判别器网络模型的参数,保持所述第一判别器网络模型的参数和所述第二判别器网络模型的参数不变,调整所述生成器网络模型的参数,直至所述生成器网络模型和所述第一判别器网络模型满足所述收敛条件。8.一种推荐理由的生成方法,其特征在于,包括:获取用户特征,所述用户特征包含标签点击特征;将所述用户特征输入根据如权利要求1至7中任一项所述的方法训练得到的生成模型,输出针对所述用户特征的POI推荐理由。9.根据权利要求8所述的方法,其特征在于,所述将所述用户特征输入根据如权利要求1至7中任一项所述的方法训练得到的生成模型,输出针对所述用户特征的POI推荐理由,包括:根据所述生成模型的生成器网络模型生成所述POI推荐理由的各推荐词的概率分布结果;对所述概率分布结果进行解码处理得到所述POI推荐理由。10.根据权利要求9所述的方法,其特征在于,所述对所述概率分布结果进行解码处理得到所述POI推荐理由,包括:按照集束搜索解码方式对所述概率分布结果进行解码处理得到局部最优解;将所述局部最优解作为所述POI推荐理由。11.根据权利要求8至10中任一项所述的方法,其特征在于,所述方法还包括:将所述POI推荐理由输入至训练完毕的文本分类模型和困惑度语言模型,输出所述POI推荐理由的语言学判断结果。12.根据权利要求8至10中任一项所述的方法,其特征在于,所述方法还包括:对所述...

【专利技术属性】
技术研发人员:王姿雯王思睿易根良张富峥武威
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1