自然语句生成的方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:24251987 阅读:34 留言:0更新日期:2020-05-22 23:48
本申请涉及一种自然语句生成的方法、装置、计算机设备和存储介质。所述方法包括:获取语料模板,并确定所述语料模板中的槽位,所述槽位包括槽位属性;向所述语料模板中的槽位填充符合所述槽位属性的词语,以获得第一自然语句;对所述第一自然语句进行续写处理,以获第二自然语句。采用本方法可以通过自动生成自然语言的方式,可以免除为了获得符合需求的语料而花费较高的获取成本的问题,也减少了人工标注语料再进行筛选时所耗费的人力和时间成本。

Method, device, computer equipment and storage medium of natural statement generation

【技术实现步骤摘要】
自然语句生成的方法、装置、计算机设备和存储介质
本申请涉及自然语言处理
,特别是涉及一种自然语句生成的方法、装置、计算机设备和存储介质。
技术介绍
随着人们对计算机科学、人工智能、语言学、以及计算机和人类(自然)语言之间的相互作用这一领域的关注,自然语言处理的技术有了长足的发展,出现了通过对自然语言进行分析,确定该自然语言的含义的技术,这个技术需要大量的语料,和合理的训练模型。现有的语料是通过人工标注费时费力,市场上也有众多公司或个人提供语料标注的服务。获取特定任务的自然语言语料或者需要人工处理大量的数据,或者需要从类似公司或个人购买,都有较高的获取成本。现有的提供语料的方式,存在效率低下或安全性低或浪费资源等问题。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够按照需求大量生成语料的一种自然语句生成的方法、装置、计算机设备和存储介质。一种自然语句生成的方法,所述方法包括:获取语料模板,并确定所述语料模板中的槽位,所述槽位包括槽位属性;向所述语料模板中的槽位填充符合所述槽位属本文档来自技高网...

【技术保护点】
1.一种自然语句生成的方法,其特征在于,所述方法包括:/n获取语料模板,并确定所述语料模板中的槽位,所述槽位包括槽位属性;/n向所述语料模板中的槽位填充符合所述槽位属性的词语,以获得第一自然语句;/n对所述第一自然语句进行续写处理,以获第二自然语句。/n

【技术特征摘要】
1.一种自然语句生成的方法,其特征在于,所述方法包括:
获取语料模板,并确定所述语料模板中的槽位,所述槽位包括槽位属性;
向所述语料模板中的槽位填充符合所述槽位属性的词语,以获得第一自然语句;
对所述第一自然语句进行续写处理,以获第二自然语句。


2.根据权利要求1所述的方法,其特征在于,所述确定语料模板中的槽位,包括:
对所述语料模板进行正则表达识别槽位,并得到每个槽位的槽位属性。


3.根据权利要求2所述的方法,其特征在于,所述向所述语料模板中的槽位填充符合所述槽位属性的词语,以获得第一自然语句,包括:
获取每个所述槽位属性所关联的词语库;
从所述词语库中选择词语填充至所述语料模板相应槽位属性对应的所述槽位中,得到第一自然语言。


4.根据权利要求1所述的方法,其特征在于,所述对所述第一自然语句进行续写处理,以获第二自然语句,包括:
将第一自然语句输入训练好的语句续写模型,以获得第二自然语句。


5.根据权利要求4所述的方法,其特征在于,所述将第一自然语句输入训练好的语句续写模型,以获得第二自然语句之前,还包括:
搭建一神经网络模型,所述神经网络模型的损失函数通过交叉熵确定;
构建训练文本,所述训练文本包括输入数据与输出数据,所述输出数据为所述输入数据的顺移一位的映像,所述训练文本为字符串;
使用所述训练文本...

【专利技术属性】
技术研发人员:吴庭
申请(专利权)人:浙江大搜车软件技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1