一种智能写作方法和装置制造方法及图纸

技术编号：19543689 阅读：78 留言：0更新日期：2018-11-24 20:36

本说明书实施例提供训练写作模型的方法和装置以及写作方法和装置，所述写作模型包括分词单元、转换单元和循环神经网络，所述训练方法包括：获取用于训练所述写作模型的样本，所述样本包括文本和针对所述文本的标定值，所述标定值指示所述文本是否通顺；以及利用所述样本训练所述写作模型，使得：在对所述写作模型输入所述文本之后，相比于训练前，所述写作模型在所述训练后的输出值与所述标定值之差的绝对值减小。

An Intelligent Writing Method and Device

The embodiments of this specification provide methods and devices for training writing models, as well as writing methods and devices. The writing models include word segmentation units, conversion units and cyclic neural networks. The training methods include acquiring samples for training the writing models, including texts and calibration for the texts. The calibration value indicates whether the text is smooth or not; and the writing model is trained with the sample so that the absolute value of the difference between the output value and the calibration value of the writing model after the input of the text and before the training decreases.

全部详细技术资料下载

【技术实现步骤摘要】
一种智能写作方法和装置
本说明书实施例涉及机器学习
，更具体地，涉及一种训练写作模型的方法和装置、以及一种写作方法和装置。
技术介绍
随着当今新媒体的爆炸式发展，舆论宣传的手段日益丰富，这给写作宣传工作带来很大的挑战。对于每个突发事件以及各种社会热点问题，不仅需要及时地进行回应，而且要根据各种传媒、读者的特点写出相应风格的文章，如微博、微信、知乎、头条等等。这样极大地增加了写稿的工作量。因此，通过智能写作工具进行自动写稿，能够极大提高写稿的工作效率，在品牌宣传和公关中抢占先机。目前已有的智能写作工具包括Giiso智能写作机器人、以及学术界的自动写作工具。在上述现有的智能写作工具中，在写稿的过程中，人工干预非常少，而在写稿完成后，需要大量人力进行校对；另外，完成的文章偏于格式化，例如，完成的文章为表格式的，不能适用多种写稿场景。因此，需要一种更有效的智能写作方法。
技术实现思路
本说明书实施例旨在提供一种更有效的智能写作方法，以解决现有技术中的不足。为实现上述目的，本说明书一个方面提供一种训练写作模型的方法，所述写作模型包括分词单元、转换单元和循环神经网络，所述方法包括：获取用于训练所述写作模型的样本，所述样本包括文本和针对所述文本的标定值，所述标定值指示所述文本是否通顺；以及利用所述样本训练所述写作模型，使得：在对所述写作模型输入所述文本之后，相比于训练前，所述写作模型在所述训练后的输出值与所述标定值之差的绝对值减小，其中，在对所述写作模型输入所述文本之后，所述分词单元从所述文本获取顺序排列的多个分词，其中，所述多个分词根据其在所述文本中的前后位置顺序排...

【技术保护点】
1.一种训练写作模型的方法，所述写作模型包括分词单元、转换单元和循环神经网络，所述方法包括：获取用于训练所述写作模型的样本，所述样本包括文本和针对所述文本的标定值，所述标定值指示所述文本是否通顺；以及利用所述样本训练所述写作模型，使得：在对所述写作模型输入所述文本之后，相比于训练前，所述写作模型在所述训练后的输出值与所述标定值之差的绝对值减小，其中，在对所述写作模型输入所述文本之后，所述分词单元从所述文本获取顺序排列的多个分词，其中，所述多个分词根据其在所述文本中的前后位置顺序排列，所述转换单元将所述顺序排列的多个分词转换成对应的顺序排列的多个词向量，所述循环神经网络基于所述顺序排列的多个词向量输出所述写作模型的输出值。

【技术特征摘要】
1.一种训练写作模型的方法，所述写作模型包括分词单元、转换单元和循环神经网络，所述方法包括：获取用于训练所述写作模型的样本，所述样本包括文本和针对所述文本的标定值，所述标定值指示所述文本是否通顺；以及利用所述样本训练所述写作模型，使得：在对所述写作模型输入所述文本之后，相比于训练前，所述写作模型在所述训练后的输出值与所述标定值之差的绝对值减小，其中，在对所述写作模型输入所述文本之后，所述分词单元从所述文本获取顺序排列的多个分词，其中，所述多个分词根据其在所述文本中的前后位置顺序排列，所述转换单元将所述顺序排列的多个分词转换成对应的顺序排列的多个词向量，所述循环神经网络基于所述顺序排列的多个词向量输出所述写作模型的输出值。2.根据权利要求1所述的训练写作模型的方法，其中，所述文本包括一篇现有文章中的非相邻的两个文本，以及所述标定值为0。3.根据权利要求1所述的训练写作模型的方法，其中，所述文本包括分别属于两篇现有文章的两个文本，以及所述标定值为0。4.根据权利要求1所述的训练写作模型的方法，其中，所述文本顺序包括一篇现有文章中的相邻排列的两个文本，以及所述标定值为1。5.根据权利要求2-4中任一项所述的训练写作模型的方法，其中，所述现有文章为属于选定领域的现有文章，并且，所述写作模型在所述训练之后用于写作属于所述选定领域的文章。6.根据权利要求1所述的训练写作模型的方法，其中，利用所述样本训练所述写作模型包括，利用所述样本，通过反向传播算法训练所述写作模型。7.根据权利要求1所述的训练写作模型的方法，其中，所述循环神经网络包括以下一种网络：RNN、LSTM和GRU。8.一种写作方法，包括：获取待写文章的第一待写文本的n个第一候选文本和第二待写文本的m个第二候选文本，其中n、m为预定数目，以及其中，在所述待写文章中，所述第一待写文本位于所述第二待写文本的前面、并与所述第二待写文本相邻；将所述第一候选文本中的每个文本与所述第二候选文本中的每个文本两两组合，从而获取n×m个输入文本，其中，在每个所述输入文本中，所述第一候选文本位于所述第二候选文本的前面；将所述n×m个输入文本分别输入通过根据权利要求1-7中任一项所述的方法训练的写作模型，以获取与所述n×m个输入文本分别对应的n×m个模型输出值，所述模型输出值预测对应的输入文本的通顺程度；以及基于所述n×m个模型输出值，从所述n个第一候选文本中确定所述第一待写文本的选定文本，以及从所述m个第二候选文本确定所述第二待写文本的选定文本。9.一种写作方法，包括：获取待完成文章中的待写文本的q个候选文本，其中q为预定数目；从所述待完成文章中获取将与所述待写文本相邻、且位于所述待写文本的前面的预定长度的已有文本；将所述已有文本与所述q个候选文本分别组合，以获取q个输入文本，其中，在每个所述输入文本中，所述已有文本位于所述候选文本的前面；将所述q个输入文本分别输入通过根据权利要求1-7中任一项所述的方法训练的写作模型，以获取与所述q个输入文本分别对应的q个模型输出值，所述模型输出值预测对应的输入文本的通顺程度；以及基于所述q个模型输出值，从所述q个候选文本中确定所述待写文本的选定文本。10.根据权利要求8或9所述的写作方法，还包括，在确定所述选定文本之后，对所述选定文本中的词和/或句进行同义替换。11.根据权利要求9所述的写作方法，其中，所述获取待完成文章中的待写文本的q个候选文本包括，获取所述待写文本的至少一个关键词；以及，基于所述关键词，获取所述待写文本的q个候选文本。12.根据权利要求11所述的写作方法，还包括，在获取所述待写文本的至少一个关键词之前，获取所述待完成文章的主题的关键词。13.根据权利要求11或12所述的写作方法，其中，所述基于所述关键词，获取所述待写文本的q个候选文本包括，根据预定搜索和排序方法，在与所述待写文本对应的语料库中基于所述关键词进行搜索，从而获取所述q个候选文本。14.根据权利要求13所述的写作方法，其中，与所述待写文本对应的语料库包括以下至少一种：与所述待写文本的领域对应的语料库、以及与所述待写文本的形式对应的语料库。15.一种训练写作模型的装置，所述写作模型包括分词单元、转换单元和循环神经网络，所述装置包括：获取单元，配置为，获取用于训练所述...

【专利技术属性】
技术研发人员：龙翀，秦昊，王雅芳，张晓彤，姚琳琳，韩非吾，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人