The embodiment of the invention discloses an article style conversion method, device, computer equipment and storage medium. This method belongs to artificial intelligence technology. The method includes: processing the original text and the corresponding stylized text separately to get the original text word segmentation sequence and the stylized text word segmentation sequence; training the words in the original text word segmentation sequence and the words in the stylized text word segmentation sequence to get the original text word direction. Quantity sequence and stylized text word vector sequence; training the preset encoding and decoding model through the original text word vector sequence and the stylized text word vector sequence described above; if the text to be converted is received, the stylized text to be converted is predicted and the predicted results are output through the trained encoding and decoding model, thus realizing the automation of the style of the text. Conversion improves the efficiency of style conversion and reduces the cost of style conversion.
【技术实现步骤摘要】
文章风格转换方法、装置、计算机设备及存储介质
本专利技术涉及人工智能
,尤其涉及一种文章风格转换方法、装置、计算机设备及存储介质。
技术介绍
为了满足用户的个性化阅读需求,提高用户的阅读体验,通常会对文章进行风格化转换,即由某一风格转换为另一风格,例如将白话文风格的文章转换为古诗风格的文章。在现有技术中,通过采用人为改写的方式改变文章的风格,以上方式效率极其低下,难以满足目前文章风格化转变的需求。
技术实现思路
本专利技术实施例提供了一种文章风格转换方法、装置、计算机设备及存储介质,旨在达到快速准确转换文章风格的目的。第一方面,本专利技术实施例提供了一种文章风格转换方法,其包括:分别对原始文本以及所述原始文本对应的风格化文本进行分词处理以分别得到原始文本分词序列以及风格化文本分词序列,其中,所述原始文本分词序列为对所述原始文本进行分词后得到的单词组成的序列,所述风格化文本分词序列为对所述风格化文本进行分词后得到的单词组成的序列;对所述原始文本分词序列中的单词以及所述风格化文本分词序列中的单词进行词向量训练以分别得到原始文本词向量序列以及风格化文本词向量序列,其中,所述原始文本词向量序列为所述原始文本分词序列中的单词的词向量组成的序列,所述风格化文本词向量序列为所述风格化文本分词序列中的单词的词向量组成的序列;通过所述原始文本词向量序列以及所述风格化文本词向量序列对预设的编码解码模型进行训练;若接收到待转换文本,通过训练后的编码解码模型对所述待转换文本的风格化文本进行预测并输出预测结果。第二方面,本专利技术实施例还提供了一种文章风格转换装置,其包括:第一分 ...
【技术保护点】
1.一种文章风格转换方法,其特征在于,包括:分别对原始文本以及所述原始文本对应的风格化文本进行分词处理以分别得到原始文本分词序列以及风格化文本分词序列,其中,所述原始文本分词序列为对所述原始文本进行分词后得到的单词组成的序列,所述风格化文本分词序列为对所述风格化文本进行分词后得到的单词组成的序列;对所述原始文本分词序列中的单词以及所述风格化文本分词序列中的单词进行词向量训练以分别得到原始文本词向量序列以及风格化文本词向量序列,其中,所述原始文本词向量序列为所述原始文本分词序列中的单词的词向量组成的序列,所述风格化文本词向量序列为所述风格化文本分词序列中的单词的词向量组成的序列;通过所述原始文本词向量序列以及所述风格化文本词向量序列对预设的编码解码模型进行训练;若接收到待转换文本,通过训练后的编码解码模型对所述待转换文本的风格化文本进行预测并输出预测结果。
【技术特征摘要】
1.一种文章风格转换方法,其特征在于,包括:分别对原始文本以及所述原始文本对应的风格化文本进行分词处理以分别得到原始文本分词序列以及风格化文本分词序列,其中,所述原始文本分词序列为对所述原始文本进行分词后得到的单词组成的序列,所述风格化文本分词序列为对所述风格化文本进行分词后得到的单词组成的序列;对所述原始文本分词序列中的单词以及所述风格化文本分词序列中的单词进行词向量训练以分别得到原始文本词向量序列以及风格化文本词向量序列,其中,所述原始文本词向量序列为所述原始文本分词序列中的单词的词向量组成的序列,所述风格化文本词向量序列为所述风格化文本分词序列中的单词的词向量组成的序列;通过所述原始文本词向量序列以及所述风格化文本词向量序列对预设的编码解码模型进行训练;若接收到待转换文本,通过训练后的编码解码模型对所述待转换文本的风格化文本进行预测并输出预测结果。2.根据权利要求1所述的方法,其特征在于,所述分别对原始文本以及所述原始文本对应的风格化文本进行分词处理以分别得到原始文本分词序列以及风格化文本分词序列,包括:通过预设分词工具对所述原始文本以及所述风格化文本进行分词处理以分别得到初始原始文本分词集合以及初始风格化文本分词集合;分别将所述初始原始文本分词集合以及所述初始风格化文本分词集合中的停止词去除以分别得到原始文本分词集合以及风格化文本分词集合;按照所述原始文本中各单词的顺序对所述原始文本分词集合中的单词进行排序以得到所述原始文本分词序列,以及按照所述风格化文本中各单词的顺序对所述风格化文本分词集合中的单词进行排序以得到所述风格化文本分词序列。3.根据权利要求1所述的方法,其特征在于,所述对所述原始文本分词序列中的单词以及所述风格化文本分词序列中的单词进行词向量训练以分别得到原始文本词向量序列以及风格化文本词向量序列,包括:通过预设的词向量工具分别对所述原始文本分词序列中的单词以及所述风格化文本分词序列中的单词进行词向量训练以分别得到所述原始文本分词序列中的单词的词向量以及所述风格化文本分词序列中的单词的词向量;按照所述原始文本分词序列中各单词的顺序对所述原始文本分词序列中各单词的词向量进行排序以得到所述原始文本词向量序列,以及按照所述风格化文本分词序列中各单词的顺序对所述风格化文本分词序列中各单词的词向量进行排序以得到所述风格化文本词向量序列。4.根据权利要求1所述的方法,其特征在于,所述通过所述原始文本词向量序列以及所述风格化文本词向量序列对预设的编码解码模型进行训练,包括:将所述原始文本词向量序列作为目标序列;将所述目标序列输入到所述编码解码模型的编码器中以得到语义特征向量;将所述语义特征向量输入到所述编码解码模型的解码器中以得到预测序列;判断所述预测序列与所述风格化文本词向量序列是否相同;若所述预测序列与所述风格化文本词向量序列不相同,将所述预测序列作为新的目标序列,并返回所述将所述目标序列输入到所述编码解码模型的编码器中以得到语义特征向量的步骤;若所述预测序列与所述风格化文本词向量序列相同,结束训练。5.根据权利要求1所述的方法,其特征在于,所述通过训练后的编码解码模型对所述待转换文本的风格化文本进行预测并输出预测结果,包括...
【专利技术属性】
技术研发人员:金戈,徐亮,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。