基于深度学习的文案生成方法、装置及电子设备制造方法及图纸

技术编号:24207908 阅读:20 留言:0更新日期:2020-05-20 15:29
本发明专利技术提供基于深度学习的文案生成方法、装置及电子设备,所述方法包括步骤:获取用户输入标题;采用jieba中文分词方法对所述标题进行分词操作;采用TF‑IDF算法对经过分词操作的所述标题进行关键词提取,以获得关键词集合;将所述关键词集合作为输入输送至预设文本生成算法模型中,将得到的输出作为文案。该装置采用上述方法,通过对文案数据做处理,提取出文案中重点描述的关键词作为模型的输入,构建新的训练数据,使得输入和输出有很强的对应关系,从而提高了模型生成的文案和输入间的相关性,大幅提高了生成文案的质量。

Method, device and electronic equipment of copy generation based on deep learning

【技术实现步骤摘要】
基于深度学习的文案生成方法、装置及电子设备
本专利技术属于深度神经网络自然语言
,具体涉及基于深度学习的文案生成方法、装置及电子设备。
技术介绍
目前电商行业的新产品在市场推广时都需要用到文案,以向消费者提供推荐理由,此时需要设计较好的文案以突出产品卖点。在该领域,传统方法使用标题作为输入、推荐理由文案作为输出的方式来训练模型,生成的商品推荐理由文案和人工编写的文案在质量上有较大差距,阻碍了自动化文案生成的大规模应用,具体不足体现在传统方法生成的文案无法准确地突出商品的卖点,生成的文案和输入的标题的对应关系不强。
技术实现思路
本申请的目的之一在于针对现有技术的不足之处,提供一种基于深度学习的文案生成方法,以提高生成文案的质量,所述方法包括步骤:获取用户输入标题;采用jieba中文分词方法对所述标题进行分词操作;采用TF-IDF算法对经过分词操作的所述标题进行关键词提取,以获得关键词集合;将所述关键词集合作为输入输送至预设文本生成算法模型中,将得到的输出作为文案。r>优选地,所述预设本文档来自技高网...

【技术保护点】
1.一种基于深度学习的文案生成方法,其特征在于,所述方法包括步骤:/n获取用户输入标题;/n采用jieba中文分词方法对所述标题进行分词操作;/n采用TF-IDF算法对经过分词操作的所述标题进行关键词提取,以获得关键词集合;/n将所述关键词集合作为输入输送至预设文本生成算法模型中,将得到的输出作为文案。/n

【技术特征摘要】
1.一种基于深度学习的文案生成方法,其特征在于,所述方法包括步骤:
获取用户输入标题;
采用jieba中文分词方法对所述标题进行分词操作;
采用TF-IDF算法对经过分词操作的所述标题进行关键词提取,以获得关键词集合;
将所述关键词集合作为输入输送至预设文本生成算法模型中,将得到的输出作为文案。


2.根据权利要求1所述的文案生成方法,其特征在于,所述预设文本生成算法模型的生成方法包括步骤:
获取若干由人工编写的推荐文案;
采用jieba中文分词方法对所述推荐文案进行分词操作;
采用TF-IDF算法对经过分词操作的所述推荐文案进行关键词提取,以获得关键词集合;
将所述关键词集合作为输入,将所述推荐文案作为输出,训练以得到所述文本生成算法模型。


3.根据权利要求1或2所述的文案生成方法,其特征在于,所述jieba中文分词方法包括步骤:
获取输入语句;
基于Trie树分词模型建立分词DAG词图;
计算全局概率Route得到基于前缀词典的词频最大切分组合;
判断所述词频最大切分组合是否为登录词;若判断为登录词,对其按词典标识的标注,并输出;若判断不为登录词,使用Token识别将中文和非中文分开处理;
若判断其为中文时,加载隐马HMM概率模型图,并使用Viterbi算法动态规则取得分词和标注,然后输出;
若判断为非中文,识别英文、数字和时间形式的组合并给予相应标注,然后输出。


4.根据权利要求3所述的文案生成方法,其特征在于,在所述基于Trie树分词模型建立分词DAG词图之前还包括步骤:
加载所述登录词词典;
建立所述Trie树分词模型。


5.根据权利要求3所述的文案生成方法,其特征在于,在所述获取输入语句和所述基于Trie树分词模型建立分词DAG词图之间还包括步骤:
对所述语句进行清洗,并判断其是否含有特殊...

【专利技术属性】
技术研发人员:赵晖沈艺齐康侯干张兵兵
申请(专利权)人:苏宁云计算有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1