【技术实现步骤摘要】
模型训练方法、生成式写作方法、装置及电子设备
[0001]本专利技术涉及智能写作
,尤其涉及一种模型训练方法
、
生成式写作方法
、
装置及电子设备
。
技术介绍
[0002]随着科技的发展和进步,用户可以登录小说网站写连载小说发表,也可以登录文学网写篇小文章发表,以此不仅能提高用户的文学素养,也能丰富用户的精神世界
。
因此,将用户内心所需表达的主题思想清楚完整的用文字描述出来,也就显得尤为重要
。
[0003]相关技术中,用户可以登录生成式网络写作,并且在写作过程中通常需要用户构思每次所需求的输入词,但这种写作方式存在的弊端是,当用户不能准确描述自己所需求的输入词时,要么先空着等后续想到了再补充,要么翻阅相关资料后确定个符合大概需求的输入词,从而导致写作过程中出现输入词遗漏或者错误
。
技术实现思路
[0004]本专利技术提供一种模型训练方法
、
生成式写作方法
、
装置及电子设备,用以解 ...
【技术保护点】
【技术特征摘要】
1.
一种模型训练方法,其特征在于,包括:获取训练样本集,所述训练样本集中含有的不同训练样本为不同写作主题的不同文本内容样本,每个所述文本内容样本为按照语义连贯性描述对应所述写作主题的输入词样本集合;基于所述训练样本集,对含有词向量模型和
LSTM
语言模型的初始模型进行训练,确定输入词生成模型;其中,所述词向量模型用于对所述写作主题或者输入词样本进行向量化;所述
LSTM
语言模型用于根据写作主题向量预测第一个输入词向量样本或者根据历史输入词向量样本预测下个输入词向量样本
。2.
根据权利要求1所述的模型训练方法,其特征在于,所述基于所述训练样本集,对含有词向量模型和
LSTM
语言模型的初始模型进行训练,确定输入词生成模型,包括:使用所述训练样本集中预设批次训练样本,对所述初始模型进行训练,获取预设轮数训练后的中间模型的模型损失;基于所述模型损失与预设模型损失的匹配成功结果,确定所述模型损失对应的中间模型为所述输入词生成模型
。3.
根据权利要求2所述的模型训练方法,其特征在于,所述使用所述训练样本集中预设批次训练样本,对所述初始模型进行训练,获取预设轮数训练后的中间模型的模型损失,包括:针对每次训练,获取对应训练样本中本次参与训练的当前输入词样本;将所述当前输入词样本输入至前次训练后的词向量模型中进行词向量转换,确定所述当前输入词样本对应的当前输入词向量样本;将所述当前输入词向量样本输入至前次训练后的
LSTM
语言模型中进行下个输入词的预测,确定所述当前输入词向量样本对应的下个预测输入词向量样本序列;基于所述下个预测输入词向量样本序列中的下个预测输入词向量样本,以及所述当前输入词向量样本对应的下个实际输入词样本向量之间的关联度和相似度,确定本次训练后的中间模型的模型损失;其中,所述下个实际输入词样本向量,是基于所述当前输入词样本在所述对应训练样本中的下个输入词样本确定的
。4.
根据权利要求3所述的模型训练方法,其特征在于,所述将所述当前输入词向量样本输入至前次训练后的
LSTM
语言模型中进行下个输入词的预测,确定所述当前输入词向量样本对应的下个预测输入词向量样本序列,包括:将所述当前输入词向量样本输入至前次训练后的
LSTM
...
【专利技术属性】
技术研发人员:李良斌,
申请(专利权)人:北京声智科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。