文章风格转换方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:21361633 阅读:23 留言:0更新日期:2019-06-15 09:23
本发明专利技术实施例公开了一种文章风格转换方法、装置、计算机设备及存储介质。该方法属于人工智能技术,该方法包括:分别对原始文本以及原始文本对应的风格化文本进行分词处理以分别得到原始文本分词序列以及风格化文本分词序列;对原始文本分词序列中的单词以及风格化文本分词序列中的单词进行词向量训练以分别得到原始文本词向量序列以及风格化文本词向量序列;通过原始文本词向量序列以及所述风格化文本词向量序列对预设的编码解码模型进行训练;若接收到待转换文本,通过训练后的编码解码模型对待转换文本的风格化文本进行预测并输出预测结果,从而能够实现文章风格的自动化转换,提高了文章风格转换的效率,降低了文章风格转换的成本。

Style Conversion Methods, Devices, Computer Equipment and Storage Media

The embodiment of the invention discloses an article style conversion method, device, computer equipment and storage medium. This method belongs to artificial intelligence technology. The method includes: processing the original text and the corresponding stylized text separately to get the original text word segmentation sequence and the stylized text word segmentation sequence; training the words in the original text word segmentation sequence and the words in the stylized text word segmentation sequence to get the original text word direction. Quantity sequence and stylized text word vector sequence; training the preset encoding and decoding model through the original text word vector sequence and the stylized text word vector sequence described above; if the text to be converted is received, the stylized text to be converted is predicted and the predicted results are output through the trained encoding and decoding model, thus realizing the automation of the style of the text. Conversion improves the efficiency of style conversion and reduces the cost of style conversion.

【技术实现步骤摘要】
文章风格转换方法、装置、计算机设备及存储介质
本专利技术涉及人工智能
,尤其涉及一种文章风格转换方法、装置、计算机设备及存储介质。
技术介绍
为了满足用户的个性化阅读需求,提高用户的阅读体验,通常会对文章进行风格化转换,即由某一风格转换为另一风格,例如将白话文风格的文章转换为古诗风格的文章。在现有技术中,通过采用人为改写的方式改变文章的风格,以上方式效率极其低下,难以满足目前文章风格化转变的需求。
技术实现思路
本专利技术实施例提供了一种文章风格转换方法、装置、计算机设备及存储介质,旨在达到快速准确转换文章风格的目的。第一方面,本专利技术实施例提供了一种文章风格转换方法,其包括:分别对原始文本以及所述原始文本对应的风格化文本进行分词处理以分别得到原始文本分词序列以及风格化文本分词序列,其中,所述原始文本分词序列为对所述原始文本进行分词后得到的单词组成的序列,所述风格化文本分词序列为对所述风格化文本进行分词后得到的单词组成的序列;对所述原始文本分词序列中的单词以及所述风格化文本分词序列中的单词进行词向量训练以分别得到原始文本词向量序列以及风格化文本词向量序列,其中,所述原始文本词向量序列为所述原始文本分词序列中的单词的词向量组成的序列,所述风格化文本词向量序列为所述风格化文本分词序列中的单词的词向量组成的序列;通过所述原始文本词向量序列以及所述风格化文本词向量序列对预设的编码解码模型进行训练;若接收到待转换文本,通过训练后的编码解码模型对所述待转换文本的风格化文本进行预测并输出预测结果。第二方面,本专利技术实施例还提供了一种文章风格转换装置,其包括:第一分词单元,用于分别对原始文本以及所述原始文本对应的风格化文本进行分词处理以分别得到原始文本分词序列以及风格化文本分词序列,其中,所述原始文本分词序列为对所述原始文本进行分词后得到的单词组成的序列,所述风格化文本分词序列为对所述风格化文本进行分词后得到的单词组成的序列;第一训练单元,用于对所述原始文本分词序列中的单词以及所述风格化文本分词序列中的单词进行词向量训练以分别得到原始文本词向量序列以及风格化文本词向量序列,其中,所述原始文本词向量序列为所述原始文本分词序列中的单词的词向量组成的序列,所述风格化文本词向量序列为所述风格化文本分词序列中的单词的词向量组成的序列;第二训练单元,用于通过所述原始文本词向量序列以及所述风格化文本词向量序列对预设的编码解码模型进行训练;预测单元,用于若接收到待转换文本,通过训练后的编码解码模型对所述待转换文本的风格化文本进行预测并输出预测结果。第三方面,本专利技术实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现上述方法。本专利技术实施例提供了一种文章风格转换方法、装置、计算机设备及存储介质。其中,所述方法包括:分别对原始文本以及所述原始文本对应的风格化文本进行分词处理以分别得到原始文本分词序列以及风格化文本分词序列;对所述原始文本分词序列中的单词以及所述风格化文本分词序列中的单词进行词向量训练以分别得到原始文本词向量序列以及风格化文本词向量序列;通过所述原始文本词向量序列以及所述风格化文本词向量序列对预设的编码解码模型进行训练;若接收到待转换文本,通过训练后的编码解码模型对所述待转换文本的风格化文本进行预测并输出预测结果,从而能够实现文章风格的自动化转换,提高了文章风格转换的效率,极大地降低了文章风格转换的成本。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种文章风格转换方法的流程示意图;图2为本专利技术实施例提供的一种文章风格转换方法的子流程示意图;图3为本专利技术实施例提供的一种文章风格转换方法的子流程示意图;图4为本专利技术实施例提供的一种文章风格转换方法的子流程示意图;图5为本专利技术实施例提供的一种文章风格转换方法的子流程示意图;图6为本专利技术实施例提供的一种文章风格转换装置的示意性框图;图7为本专利技术实施例提供的一种文章风格转换装置的第一分词单元的示意性框图;图8为本专利技术实施例提供的一种文章风格转换装置的第一训练单元的示意性框图;图9为本专利技术实施例提供的一种文章风格转换装置的第二训练单元的示意性框图;图10为本专利技术实施例提供的一种文章风格转换装置的预测单元的示意性框图;以及图11为本专利技术实施例提供的一种计算机设备的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。S1,分别对原始文本以及所述原始文本对应的风格化文本进行分词处理以分别得到原始文本分词序列以及风格化文本分词序列。其中,所述原始文本分词序列为对所述原始文本进行分词后得到的单词组成的序列,所述风格化文本分词序列为对所述风格化文本进行分词后得到的单词组成的序列。在本实施例中,原始文本以及其对应的风格化文本是预存在终端中的,具体地可由用户输入到终端中。终端可直接调用获取。或者,在其他实施例中,可通过其他方式获取原始文本以及其对应的风格化文本,本专利技术对此不做具体限定。具体实施中,对原始文本进行分词处理得到原始文本分词序列,原始文本分词序列为对所述原始文本进行分词后得到的单词组成的序列。对风格化文本进行分词处理得到风格化文本分词序列,风格化文本分词序列为对所述风格化文本进行分词后得到的单词组成的序列。需要说明的是,风格化文本为原始文本转换为某一风格后的文本,例如,在一实施例中,原始文本为“夕阳依傍着西山慢慢地沉没,滔滔黄河朝着东海汹涌奔流”,该原始文本对应的古诗本文档来自技高网...

【技术保护点】
1.一种文章风格转换方法,其特征在于,包括:分别对原始文本以及所述原始文本对应的风格化文本进行分词处理以分别得到原始文本分词序列以及风格化文本分词序列,其中,所述原始文本分词序列为对所述原始文本进行分词后得到的单词组成的序列,所述风格化文本分词序列为对所述风格化文本进行分词后得到的单词组成的序列;对所述原始文本分词序列中的单词以及所述风格化文本分词序列中的单词进行词向量训练以分别得到原始文本词向量序列以及风格化文本词向量序列,其中,所述原始文本词向量序列为所述原始文本分词序列中的单词的词向量组成的序列,所述风格化文本词向量序列为所述风格化文本分词序列中的单词的词向量组成的序列;通过所述原始文本词向量序列以及所述风格化文本词向量序列对预设的编码解码模型进行训练;若接收到待转换文本,通过训练后的编码解码模型对所述待转换文本的风格化文本进行预测并输出预测结果。

【技术特征摘要】
1.一种文章风格转换方法,其特征在于,包括:分别对原始文本以及所述原始文本对应的风格化文本进行分词处理以分别得到原始文本分词序列以及风格化文本分词序列,其中,所述原始文本分词序列为对所述原始文本进行分词后得到的单词组成的序列,所述风格化文本分词序列为对所述风格化文本进行分词后得到的单词组成的序列;对所述原始文本分词序列中的单词以及所述风格化文本分词序列中的单词进行词向量训练以分别得到原始文本词向量序列以及风格化文本词向量序列,其中,所述原始文本词向量序列为所述原始文本分词序列中的单词的词向量组成的序列,所述风格化文本词向量序列为所述风格化文本分词序列中的单词的词向量组成的序列;通过所述原始文本词向量序列以及所述风格化文本词向量序列对预设的编码解码模型进行训练;若接收到待转换文本,通过训练后的编码解码模型对所述待转换文本的风格化文本进行预测并输出预测结果。2.根据权利要求1所述的方法,其特征在于,所述分别对原始文本以及所述原始文本对应的风格化文本进行分词处理以分别得到原始文本分词序列以及风格化文本分词序列,包括:通过预设分词工具对所述原始文本以及所述风格化文本进行分词处理以分别得到初始原始文本分词集合以及初始风格化文本分词集合;分别将所述初始原始文本分词集合以及所述初始风格化文本分词集合中的停止词去除以分别得到原始文本分词集合以及风格化文本分词集合;按照所述原始文本中各单词的顺序对所述原始文本分词集合中的单词进行排序以得到所述原始文本分词序列,以及按照所述风格化文本中各单词的顺序对所述风格化文本分词集合中的单词进行排序以得到所述风格化文本分词序列。3.根据权利要求1所述的方法,其特征在于,所述对所述原始文本分词序列中的单词以及所述风格化文本分词序列中的单词进行词向量训练以分别得到原始文本词向量序列以及风格化文本词向量序列,包括:通过预设的词向量工具分别对所述原始文本分词序列中的单词以及所述风格化文本分词序列中的单词进行词向量训练以分别得到所述原始文本分词序列中的单词的词向量以及所述风格化文本分词序列中的单词的词向量;按照所述原始文本分词序列中各单词的顺序对所述原始文本分词序列中各单词的词向量进行排序以得到所述原始文本词向量序列,以及按照所述风格化文本分词序列中各单词的顺序对所述风格化文本分词序列中各单词的词向量进行排序以得到所述风格化文本词向量序列。4.根据权利要求1所述的方法,其特征在于,所述通过所述原始文本词向量序列以及所述风格化文本词向量序列对预设的编码解码模型进行训练,包括:将所述原始文本词向量序列作为目标序列;将所述目标序列输入到所述编码解码模型的编码器中以得到语义特征向量;将所述语义特征向量输入到所述编码解码模型的解码器中以得到预测序列;判断所述预测序列与所述风格化文本词向量序列是否相同;若所述预测序列与所述风格化文本词向量序列不相同,将所述预测序列作为新的目标序列,并返回所述将所述目标序列输入到所述编码解码模型的编码器中以得到语义特征向量的步骤;若所述预测序列与所述风格化文本词向量序列相同,结束训练。5.根据权利要求1所述的方法,其特征在于,所述通过训练后的编码解码模型对所述待转换文本的风格化文本进行预测并输出预测结果,包括...

【专利技术属性】
技术研发人员:金戈徐亮
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1