本发明专利技术提供基于深度学习的文案生成方法、装置及电子设备,所述方法包括步骤:获取用户输入标题;采用jieba中文分词方法对所述标题进行分词操作;采用TF‑IDF算法对经过分词操作的所述标题进行关键词提取,以获得关键词集合;将所述关键词集合作为输入输送至预设文本生成算法模型中,将得到的输出作为文案。该装置采用上述方法,通过对文案数据做处理,提取出文案中重点描述的关键词作为模型的输入,构建新的训练数据,使得输入和输出有很强的对应关系,从而提高了模型生成的文案和输入间的相关性,大幅提高了生成文案的质量。
Method, device and electronic equipment of copy generation based on deep learning
【技术实现步骤摘要】
基于深度学习的文案生成方法、装置及电子设备
本专利技术属于深度神经网络自然语言
,具体涉及基于深度学习的文案生成方法、装置及电子设备。
技术介绍
目前电商行业的新产品在市场推广时都需要用到文案,以向消费者提供推荐理由,此时需要设计较好的文案以突出产品卖点。在该领域,传统方法使用标题作为输入、推荐理由文案作为输出的方式来训练模型,生成的商品推荐理由文案和人工编写的文案在质量上有较大差距,阻碍了自动化文案生成的大规模应用,具体不足体现在传统方法生成的文案无法准确地突出商品的卖点,生成的文案和输入的标题的对应关系不强。
技术实现思路
本申请的目的之一在于针对现有技术的不足之处,提供一种基于深度学习的文案生成方法,以提高生成文案的质量,所述方法包括步骤:获取用户输入标题;采用jieba中文分词方法对所述标题进行分词操作;采用TF-IDF算法对经过分词操作的所述标题进行关键词提取,以获得关键词集合;将所述关键词集合作为输入输送至预设文本生成算法模型中,将得到的输出作为文案。优选地,所述预设文本生成算法模型的生成方法包括步骤:获取若干由人工编写的推荐文案;采用jieba中文分词方法对所述推荐文案进行分词操作;采用TF-IDF算法对经过分词操作的所述推荐文案进行关键词提取,以获得关键词集合;将所述关键词集合作为输入,将所述推荐文案作为输出,训练以得到所述文本生成算法模型。优选地,所述jieba中文分词方法包括步骤:获取输入语句;基于Trie树分词模型建立分词DAG词图;计算全局概率Route得到基于前缀词典的词频最大切分组合;判断所述词频最大切分组合是否为登录词;若判断为登录词,对其按词典标识的标注,并输出;若判断不为登录词,使用Token识别将中文和非中文分开处理;若判断其为中文时,加载隐马HMM概率模型图,并使用Viterbi算法动态规则取得分词和标注,然后输出;若判断为非中文,识别英文、数字和时间形式的组合并给予相应标注,然后输出。优选地,在所述基于Trie树分词模型建立分词DAG词图之前还包括步骤:加载所述登录词词典;建立所述Trie树分词模型。优选地,在所述获取输入语句和所述基于Trie树分词模型建立分词DAG词图之间还包括步骤:对所述语句进行清洗,并判断其是否含有特殊字符;若判断含有所述特殊字符,将其分离并标识为未知词性然后输出。本申请的目的之二在于针对现有技术的不足之处,提供一种基于深度学习的文案生成装置,以提高生成文案的质量,所述装置包括:获取单元,用于获取用户输入标题;分词单元,用于采用jieba中文分词方法对所述标题进行分词操作;关键词集合获取单元,用于采用TF-IDF算法对经过分词操作的所述标题进行关键词提取,以获得关键词集合;文案获取单元,用于将所述关键词集合作为输入输送至预设文本生成算法模型中,将得到的输出作为文案;存储单元,用于存储所述jieba中文分词方法、所述TF-IDF算法和所述预设文本生成算法模型。优选地,所述装置还包括:预设文本生成算法模型获取单元,用于获取所述预设文本生成算法模型。优选地,所述预设文本生成算法模型获取单元包括:推荐文案获取单元,用于获取若干由人工编写的推荐文案;推荐文案分词单元,用于采用jieba中文分词方法对所述推荐文案进行分词操作;推荐文案关键词集合获取单元,用于采用TF-IDF算法对经过分词操作的所述推荐文案进行关键词提取,以获得关键词集合;训练单元,用于将所述关键词集合作为输入,将所述推荐文案作为输出,训练以得到所述文本生成算法模型。本申请的目的之三在于针对现有技术的不足之处,提供一种电子设备,以提高生成文案的质量,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述任一所述文案生成方法。本申请的目的之四在于针对现有技术的不足之处,提供一种非暂态计算机可读存储介质,以提高生成文案的质量,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述任一所述文案生成方法。本申请通过对文案数据做处理,提取出文案中重点描述的关键词作为模型的输入,构建新的训练数据,使得输入和输出有很强的对应关系,从而提高了模型生成的文案和输入间的相关性,大幅提高了生成文案的质量。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术提供的一种基于深度学习的文案生成方法的方法流程图;图2是本专利技术提供的一种基于深度学习的文案生成方法的方法流程图;图3是本专利技术中采用的jieba中文分词方法的方法流程图;图4是本专利技术提供的一种基于深度学习技术的智能文案生成装置的结构示意图;图5是本专利技术提供的预设文本生成算法模型获取单元的结构示意图;图6是本专利技术提供的一种电子设备的结构示意图。具体实施方式下面结合附图对本公开实施例进行详细描述。以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意本文档来自技高网...
【技术保护点】
1.一种基于深度学习的文案生成方法,其特征在于,所述方法包括步骤:/n获取用户输入标题;/n采用jieba中文分词方法对所述标题进行分词操作;/n采用TF-IDF算法对经过分词操作的所述标题进行关键词提取,以获得关键词集合;/n将所述关键词集合作为输入输送至预设文本生成算法模型中,将得到的输出作为文案。/n
【技术特征摘要】
1.一种基于深度学习的文案生成方法,其特征在于,所述方法包括步骤:
获取用户输入标题;
采用jieba中文分词方法对所述标题进行分词操作;
采用TF-IDF算法对经过分词操作的所述标题进行关键词提取,以获得关键词集合;
将所述关键词集合作为输入输送至预设文本生成算法模型中,将得到的输出作为文案。
2.根据权利要求1所述的文案生成方法,其特征在于,所述预设文本生成算法模型的生成方法包括步骤:
获取若干由人工编写的推荐文案;
采用jieba中文分词方法对所述推荐文案进行分词操作;
采用TF-IDF算法对经过分词操作的所述推荐文案进行关键词提取,以获得关键词集合;
将所述关键词集合作为输入,将所述推荐文案作为输出,训练以得到所述文本生成算法模型。
3.根据权利要求1或2所述的文案生成方法,其特征在于,所述jieba中文分词方法包括步骤:
获取输入语句;
基于Trie树分词模型建立分词DAG词图;
计算全局概率Route得到基于前缀词典的词频最大切分组合;
判断所述词频最大切分组合是否为登录词;若判断为登录词,对其按词典标识的标注,并输出;若判断不为登录词,使用Token识别将中文和非中文分开处理;
若判断其为中文时,加载隐马HMM概率模型图,并使用Viterbi算法动态规则取得分词和标注,然后输出;
若判断为非中文,识别英文、数字和时间形式的组合并给予相应标注,然后输出。
4.根据权利要求3所述的文案生成方法,其特征在于,在所述基于Trie树分词模型建立分词DAG词图之前还包括步骤:
加载所述登录词词典;
建立所述Trie树分词模型。
5.根据权利要求3所述的文案生成方法,其特征在于,在所述获取输入语句和所述基于Trie树分词模型建立分词DAG词图之间还包括步骤:
对所述语句进行清洗,并判断其是否含有特殊...
【专利技术属性】
技术研发人员:赵晖,沈艺,齐康,侯干,张兵兵,
申请(专利权)人:苏宁云计算有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。