一种基于神经网络的协作频谱感知和预测方法技术

技术编号:39062941 阅读:15 留言:0更新日期:2023-10-12 19:55
本发明专利技术涉及写作学习技术领域,且公开了一种基于神经网络的协作频谱感知和预测方法,包括以下步骤:首先对神经网络检测器进行预训练,通过神经网络检测器在各个边缘节点进行欠采样、对多组具有标记的训练集进行二次处理,从而得出训练序列集合Y,提取出的词汇得到词汇序列集合X,通过对词汇序列集合X和训练序列集合Y进行不断的交替对抗,从而得出形成的特征向量与真实句子集合Z进行不断替换,并且通过不同任意词汇序列集合X的碰撞可以做到对特征向量进行润色,从而提高样本是真实序列对的概率p,从而提高装置的使用效率,这种自动化的方法,也避免了本发明专利技术对特定语料的依赖,使本发明专利技术可以用于不同语言和领域的写作辅助任务。发明专利技术可以用于不同语言和领域的写作辅助任务。发明专利技术可以用于不同语言和领域的写作辅助任务。

【技术实现步骤摘要】
一种基于神经网络的协作频谱感知和预测方法


[0001]本专利技术涉及写作学习
,具体为一种基于神经网络的协作频谱感知和预测方法。

技术介绍

[0002]写作是一种将若干词语以一定的规则组织成句子的过程,对于以母语写作的人来说,这个过程往往是非常简单而自然的。然而当使用外语写作时,由于不同语言之间表达习惯和语法的差异,如果对该种语言不够熟悉,常常面临不知如何将词语组织成句子的问题,频谱感知,即通过接收信号来判断当前频谱是否被占用,已经受到越来越广泛的关注。频谱感知技术因为其应用的广泛性,神经网络它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型,这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。
[0003]正常使用者在进行学习外语时通常都会去选择记忆很多的单词,然后通过单词组成不同的句子,相同的单词在不同的句子里面可能会有不同的解释,使用者通过大量学习单词进行学习不同的写作语言。
[0004]但是由于实际写作过程中,作者当前可能只有句子原型或几个核心的单词,但不知该如何将它们组织起来,形成流畅的句子。遇到这样的问题时,作者通常会先去了解每个词语或短语的用法,然后根据这些用法将它们组织起来,但是考虑到不同的语境和不同词汇之间的搭配,这种方法较为低效,从而影响了该方法的实用性;鉴于此,我们提出一种基于神经网络的协作频谱感知和预测方法。

技术实现思路

[0005]本专利技术的目的在于提供一种基于神经网络的协作频谱感知和预测方法,以解决上述
技术介绍
中提出的问题。
[0006]为实现上述目的,本专利技术提供如下技术方案:一种基于神经网络的协作频谱感知和预测方法,包括以下步骤:
[0007]步骤S1,预训练阶段:首先对神经网络检测器进行预训练,通过神经网络检测器在各个边缘节点进行欠采样,从而获取N个时刻内所述边缘节点的频谱信息,并且对欠采样的数据进行标记,其中有标记的采样数据作为训练集,无标记的采样数据作为测试数据;
[0008]步骤S2,重复步骤S1中的欠采样工作,从而的、得到多组具有标记的训练集,通过对多组具有标记的训练集进行二次处理,从而得出训练序列集合Y,从训练序列集合Y中提取出基于词性的词汇,提取出的词汇得到词汇序列集合X,对于任意词汇序列集合X∈Y,训练序列集合Y为写作时产生的顺畅完整的句子,词汇序列集合X为顺畅完整句子中的一些关键性词语,通过多组词汇序列集合X拼接可以形成一组完整的训练序列集合Y;
[0009]步骤S3,将训练序列集合Y和词序列集合X输入到神经网络,从而进行模型训练,通过对词序列集合X进行有序排列组合进行形成句子并与训练序列集合Y进行比较;
[0010]步骤S4,预训练一组文本段落生成器,通过在神经网络检测器内部提取出真实句子集合Z,然后通过将真实句子集合Z对{x,y+}和关键词序列

生成句子对{x,y

},给定样本{x,y},分类器首先使用神经网络分别提取x和y的特征得到特征向量[f1(x);f2(y)],然后利用多层感知机处理特征向量,得到样本对概率是真实序列对的概率p;
[0011]步骤S5,通过对词汇序列集合X和训练序列集合Y进行不断的交替对抗,从而得出形成的特征向量[f1(x);f2(y)]与真实句子集合Z进行不断替换,从而得出特征向量[f1(x);f2(y)]可以更加接近真实句子集合Z中段落的真实意思,并且通过不同任意词汇序列集合X的碰撞可以做到对特征向量[f1(x);f2(y)]进行润色,从而提高样本是真实序列对的概率p;
[0012]步骤S6,对真实序列对的概率p进行统计,真实序列对的概率p=(Y,Z),通过提高真实序列对的概率p的效率,从而可以生成对真实句子集合Z进行润色以后的句子。
[0013]优选的,所述步骤S1中的预训练包括对频谱信息进行提取,提取过程就是对正常用语与网络用语、口头用语、不同地区用语的欠采样过程,并且步骤S1中的预训练还可以对非法语句与非规范语句进行过滤处理。
[0014]优选的,所述步骤S2中从训练序列集合Y中提取出基于词性的词汇,是通过为不同词性和词频的词语分配不同的留存概率,从而筛选出包含关键语义的词语作为词汇序列集合X,该过程实现对真实关键词生成过程的模拟,通过将不断提取词汇序列集合X从而得出在进行替换真实句子时可以增加写作的可能性。
[0015]优选的,所述步骤S3使用正逆向的循环神经网络编码关键词序列,就是在每个训练序列集合Y提取出一段句子,然后在每个时间点通过加入词汇序列集合X中与句子相适配的关键词进行替换与填充,直到整个序列都被编码到摘要向量中,同时在每个解码步t,使用当前时间步的解码器隐层状态h

t和编码器得到的源序列的上下文特征矩阵H计算一个注意力向量at,该向量记录了与当前解码步相关的上下文信息,并过滤了无关的信息。
[0016]优选的,所述步骤S4中特征向量[f1(x);f2(y)]需要通过多次训练得到:
[0017][f1(x)f2(y)]={(y(1),x1)),(y(2),x(2)),...,(y(k),x(k)),...,(y(K),x(K))}其中Y表示训练序列集合Y,即(y(k),x(k))表示第k个样本,k=1,2,...,K,K是总的样本数,对于频谱感知模型,x(k)=1和x(k)=0分别表示G1和G2,G1加G2得到真实序列对的概率p。
[0018]优选的,所述步骤S5中真实句子集合Z的集合为(1.2.3.n),通过将单独提取真实句子集合Z中的某一个子集n,从而得出特征向量[f1(x);f2(y)]与真实句子集合Z进行不断替换,在替换过程中子集n还需要与真实句子集合Z中其他子集进行比较语意,从而可以提高得到真实序列对的概率p的运算效率,并且使替换后的句子更加通顺符合预期。
[0019]优选的,所述步骤S5中子集n与真实句子集合Z中其他子集进行比较语意时,子集n满足正常语境后便可生成真实结果,结果集合合计为M,子集n不满足正常语境会回到特征向量[f1(x);f2(y)]中继续与真实句子集合Z中其他子集进行比较语意,从而完成预期。
[0020]优选的,所述步骤S6中基于强化学习真实句子集合Z的期望,将真实序列对的概率p的得分作为对其策略的奖励,真实序列对的概率p的目标是最大化累积策略奖励的期望,为了获得对中间状态,即序列生成过程中的每个中间时间步的奖励,对于长度为T的候选目标序列,在其每个解码步t,利用蒙特卡罗搜索采样出未解码的最后T

t个标记,同前t个时
间步生成的标记一起作为一个完整的序列提供给判别器以计算奖励,并将N次蒙特卡罗搜索得到的奖励的均值作为对第t个时间步的奖励的估计,N为设定值。
[0021]优选的,所述步骤1生成器生成文本的过程基于贪心搜索/采样、集束搜索、序列扩展以及随机采样。
[0022]与现有技术相比,本专利技术提供了一种基于神本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络的协作频谱感知和预测方法,其特征在于,包括以下步骤:步骤S1,预训练阶段:首先对神经网络检测器进行预训练,通过神经网络检测器在各个边缘节点进行欠采样,从而获取N个时刻内所述边缘节点的频谱信息,并且对欠采样的数据进行标记,其中有标记的采样数据作为训练集,无标记的采样数据作为测试数据;步骤S2,重复步骤S1中的欠采样工作,从而的、得到多组具有标记的训练集,通过对多组具有标记的训练集进行二次处理,从而得出训练序列集合Y,从训练序列集合Y中提取出基于词性的词汇,提取出的词汇得到词汇序列集合X,对于任意词汇序列集合X∈Y,训练序列集合Y为写作时产生的顺畅完整的句子,词汇序列集合X为顺畅完整句子中的一些关键性词语,通过多组词汇序列集合X拼接可以形成一组完整的训练序列集合Y;步骤S3,将训练序列集合Y和词序列集合X输入到神经网络,从而进行模型训练,通过对词序列集合X进行有序排列组合进行形成句子并与训练序列集合Y进行比较;步骤S4,预训练一组文本段落生成器,通过在神经网络检测器内部提取出真实句子集合Z,然后通过将真实句子集合Z对{x,y+}和关键词序列

生成句子对{x,y

},给定样本{x,y},分类器首先使用神经网络分别提取x和y的特征得到特征向量[f1(x);f2(y)],然后利用多层感知机处理特征向量,得到样本对概率是真实序列对的概率p;步骤S5,通过对词汇序列集合X和训练序列集合Y进行不断的交替对抗,从而得出形成的特征向量[f1(x);f2(y)]与真实句子集合Z进行不断替换,从而得出特征向量[f1(x);f2(y)]可以更加接近真实句子集合Z中段落的真实意思,并且通过不同任意词汇序列集合X的碰撞可以做到对特征向量[f1(x);f2(y)]进行润色,从而提高样本是真实序列对的概率p;步骤S6,对真实序列对的概率p进行统计,真实序列对的概率p=(Y,Z),通过提高真实序列对的概率p的效率,从而可以生成对真实句子集合Z进行润色以后的句子。2.根据权利要求1所述的一种基于神经网络的写作频谱感知和预测方法,其特征在于:所述步骤S1中的预训练包括对频谱信息进行提取,提取过程就是对正常用语与网络用语、口头用语、不同地区用语的欠采样过程,并且步骤S1中的预训练还可以对非法语句与非规范语句进行过滤处理。3.根据权利要求1所述的一种基于神经网络的协作频谱感知和预测方法,其特征在于:所述步骤S2中从训练序列集合Y中提取出基于词性的词汇,是通过为不同词性和词频的词语分配不同的留存概率,从而筛选出包含关键语义的词语作为词汇序列集合X,该过程实现对真实关键词生成过程的模拟。4.根据权利要求1所述的一种基于神经网络的协作频谱感知和预测方法,其特征在于:所述步骤S3...

【专利技术属性】
技术研发人员:郑礼闫光辉严天峰廉敬汤春阳杨昕李沛儒
申请(专利权)人:甘肃唐誉科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1