基于强化学习的营销文案自动生成方法、装置及存储介质制造方法及图纸

技术编号:46601278 阅读:0 留言:0更新日期:2025-10-10 21:32
本申请提供一种基于强化学习的营销文案自动生成方法、装置及存储介质。该方法包括:对公开文案数据进行语义匹配检索得到候选文案;将插槽化改写指令输入预生成语言模型,生成第一营销文案;对预设基础语言模型执行监督微调训练,得到第一训练模型;输入新的用户产品信息与推广要求至第一训练模型,生成第二营销文案,对第二营销文案进行打分并生成评价数据;根据评价数据构建偏序训练样本,将偏序训练样本作为奖励信号,对第一训练模型执行强化学习训练,得到第二训练模型;在文案生成系统中调用第二训练模型,基于用户的产品信息与推广要求输出目标营销文案。本申请能够实现高合规度且多约束一致的营销文案批量生成。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种基于强化学习的营销文案自动生成方法、装置及存储介质


技术介绍

1、随着电商、短视频和社交平台的快速发展,企业对商品营销文案的需求呈现爆发式增长。合规、精准且富有创意的营销文案能够显著提升商品曝光率和转化率,因此各类基于自然语言处理的自动文案生成技术受到广泛关注。大规模预训练语言模型(largelanguage model, llm)因具备通用文本生成和上下文理解能力,成为当前自动化内容生产的核心技术路线之一。

2、主流解决方案通常采用公开的大规模语料对llm进行预训练,再通过少量示例(few-shot)或提示工程(prompt engineering)生成营销文本。为提升垂直领域表现,一些研究引入监督微调(supervised fine-tuning,sft)或基于人类反馈的强化学习(rlhf)对模型进行再训练,以注入特定行业知识和写作风格。另有方法通过关键词插入、模板替换或检索增强生成(retrieval-augmented generation)等手段,将商品属性信息融入生成过程,以提高文本与商品的对应性。本文档来自技高网...

【技术保护点】

1.一种基于强化学习的营销文案自动生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述公开文案数据进行语义匹配检索,得到与所述产品信息相关的候选文案,包括:

3.根据权利要求1所述的方法,其特征在于,所述构建包含所述候选文案、所述产品信息和所述营销要点的插槽化改写指令,包括:

4.根据权利要求1所述的方法,其特征在于,所述将所述插槽化改写指令输入预生成语言模型,使所述预生成语言模型在预设插槽位置填入对应的产品信息和营销要点,生成第一营销文案,包括:

5.根据权利要求1所述的方法,其特征在于,所述利用所述监督微调...

【技术特征摘要】

1.一种基于强化学习的营销文案自动生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述公开文案数据进行语义匹配检索,得到与所述产品信息相关的候选文案,包括:

3.根据权利要求1所述的方法,其特征在于,所述构建包含所述候选文案、所述产品信息和所述营销要点的插槽化改写指令,包括:

4.根据权利要求1所述的方法,其特征在于,所述将所述插槽化改写指令输入预生成语言模型,使所述预生成语言模型在预设插槽位置填入对应的产品信息和营销要点,生成第一营销文案,包括:

5.根据权利要求1所述的方法,其特征在于,所述利用所述监督微调训练样本对预设基础语言模型执行监督微调训练,得到第一训练模型,包括:

6.根据权利要求1所述的方法,其特征...

【专利技术属性】
技术研发人员:姜澈张开颜华尔默贾国力郑元春
申请(专利权)人:北京衔远有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1