对于网络特征词进行数据模型筛选方法技术

技术编号:19964410 阅读:35 留言:0更新日期:2019-01-03 12:55
本发明专利技术提出了一种对于网络特征词进行数据模型筛选方法,包括如下步骤:根据遗传算法形成特征词的计算模型,设置特征词分布的权重规则条件,根据特征词分布结果形成均衡图划分算法,最终对特征词做出准确提炼。

Data Model Screening Method for Network Feature Words

The present invention proposes a data model screening method for network feature words, which includes the following steps: forming a computing model of feature words based on genetic algorithm, setting the weight rule conditions of feature words distribution, forming a balanced graph partitioning algorithm according to the result of feature words distribution, and finally accurately extracting feature words.

【技术实现步骤摘要】
对于网络特征词进行数据模型筛选方法
本专利技术涉及计算机数据挖掘领域,尤其涉及一种对于网络特征词进行数据模型筛选方法。
技术介绍
由于互联网应用十分普及,但是对于网络环境中海量的数据无法得到及时的归类以及提炼,通常网络使用者都会对海量的数据束手无策,现有技术中协同过滤的推荐方法利用用户的兴趣偏好相似性来产生推荐,把相似用户喜欢关键词或者特征点推荐给对应节点。但是匹配的并不准确和完整。这就亟需本领域技术人员解决相应的技术问题。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种对于网络特征词进行数据模型筛选方法。为了实现本专利技术的上述目的,本专利技术提供了一种对于网络特征词进行数据模型筛选方法,包括如下步骤:S1,根据遗传算法形成特定网络环境特征词的计算模型,用户形成特征词预测模型:其中,a1为简单特征词记录值;a2为词组特征词记录值;a3为句式特征词记录值;wa为特征词相关程度权重,pi为特征词动态变化趋势量;ri为特征词获取完成量;为特征词动态变化随机干扰分量,γ为平衡系数,m为正整数;S1-2,选择特征词网络预测模型:其中,b1为陌生网络特征词出现频率预测值;b2为熟悉网络特征词出现频率预测值;b3为二级域名网络特征词出现频率预测值;b4为一级域名网络特征词出现频率预测值;R为诊断周期分量;Vj为特征词出现率随机干扰分量,t为响应周期,为匹配偏差因子,μ为重合度消耗增量因子,β为网络延迟影响系数,Ψ为正态适度响应值,Aj为特征词出现次数动态预测值;S2,对于特征词分布考虑到各种特性之间的相关性,定义N为特征词匹配成功数据,L为特征词匹配未成功数据,M为未进行匹配的特征词数据,Sk为特征词种类分量,B为偏移值,为特征词匹配成功数据限制函数,为特征词匹配未成功数据限制函数,为未进行匹配的特征词数据限制函数,特征词匹配成功实例xk,特征词匹配未成功实例yk,未进行匹配的特征词实例zk,构建相关性权重规则如下:xk,yk∈N+Lorxk,yk,zk∈N+L+M;S2-2,进行特征词分布目标函数构建,形成特征词数据的目标函数算法如下:w为特征词出现次数的偏置项,δ为特征词数据噪声,Pi(k)为特征词选择过程向量,k为特征词数量,eW为迭代分量,字母W为区分度,下标i为正整数;用该目标函数来度量过程向量Ci(k)的平滑状态值;得到的平滑部分和高斯混合模型的似然估计进行线性组合,其中为特征词匹配成功估计因子,为特征词匹配未成功估计因子,为未进行匹配的特征词估计因子,为特征词匹配成功获取样本,为特征词匹配未成功获取样本,为未进行匹配的特征词获取样本,为特征词匹配成功损失样本,为特征词匹配未成功损失样本,为未进行匹配的特征词损失样本,优选的,包括如下步骤:该算法不仅考虑了数据的正态分布信息,也考虑了数据间的几何结构信息通过度量平滑度最终将特征词分布相关度进行优化划分做准备。综上所述,由于采用了上述技术方案,本专利技术的有益效果是:通过对特征词种类预测形成初步计算条件;从而筛选出特征词分布结果;该算法不仅考虑了数据的正态分布信息,也考虑了数据间的几何结构信息通过度量平滑度最终将特征词分布相关度进行优化划分做准备;然后完成最大值的提炼数据集,把特征词数据进行收集整理。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术工作流程图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。如图1所示,本专利技术提供了一种对于网络特征词进行数据模型筛选方法,包括如下步骤:S1,根据遗传算法形成特定网络环境特征词的计算模型,用户形成特征词预测模型:其中,a1为简单特征词记录值;a2为词组特征词记录值;a3为句式特征词记录值;wa为特征词相关程度权重,pi为特征词动态变化趋势量;ri为特征词获取完成量;为特征词动态变化随机干扰分量,γ为平衡系数,m为正整数;S1-2,选择特征词网络预测模型:其中,b1为陌生网络特征词出现频率预测值;b2为熟悉网络特征词出现频率预测值;b3为二级域名网络特征词出现频率预测值;b4为一级域名网络特征词出现频率预测值;R为诊断周期分量;Vj为特征词出现率随机干扰分量,t为响应周期,为匹配偏差因子,μ为重合度消耗增量因子,β为网络延迟影响系数,Ψ为正态适度响应值,Aj为特征词出现次数动态预测值;S2,对于特征词分布考虑到各种特性之间的相关性,定义N为特征词匹配成功数据,L为特征词匹配未成功数据,M为未进行匹配的特征词数据,Sk为特征词种类分量,B为偏移值,为特征词匹配成功数据限制函数,为特征词匹配未成功数据限制函数,为未进行匹配的特征词数据限制函数,特征词匹配成功实例xk,特征词匹配未成功实例yk,未进行匹配的特征词实例zk,构建相关性权重规则如下:xk,yk∈N+Lorxk,yk,zk∈N+L+M;S2-2,进行特征词分布目标函数构建,形成特征词数据的目标函数算法如下:w为特征词出现次数的偏置项,δ为特征词数据噪声,Pi(k)为特征词选择过程向量,k为特征词数量,eW为迭代分量,字母W为区分度,下标i为正整数;用该目标函数来度量过程向量Ci(k)的平滑状态值;得到的平滑部分和高斯混合模型的似然估计进行线性组合,其中为特征词匹配成功估计因子,为特征词匹配未成功估计因子,为未进行匹配的特征词估计因子,为特征词匹配成功获取样本,为特征词匹配未成功获取样本,为未进行匹配的特征词获取样本,为特征词匹配成功损失样本,为特征词匹配未成功损失样本,为未进行匹配的特征词损失样本,优选的,包括如下步骤:该算法不仅考虑了数据的正态分布信息,也考虑了数据间的几何结构信息通过度量平滑度最终将特征词分布相关度进行优化划分做准备。采用标签传播的方法,每次迭代过程中进行特征词相关度匹配,从而对特征词诊断过程中提炼出相关特征词经常入住的医院和医院级别;为了防止过大的提炼数据集出现,对数据集的规模以及迭代次数进行了限制,每个数据集规模条件为TV为获取诊断数据的极值,τ表示数据集获取系数,r为诊断样本分类数,Z为正整数;载入提炼数据集规模条件进行累加之后,如果其中为提炼诊断符合度,形成最大值的提炼数据集把特征词诊断数据进行收集。尽管已经示出和描述了本专利技术的实施例,本领域的普通技术人员可以理解:在不脱离本专利技术的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本专利技术的范围由权利要求及其等同物限定。本文档来自技高网...

【技术保护点】
1.一种对于网络特征词进行数据模型筛选方法,其特征在于,包括如下步骤:S1,根据遗传算法形成特定网络环境特征词的计算模型,用户形成特征词预测模型:

【技术特征摘要】
1.一种对于网络特征词进行数据模型筛选方法,其特征在于,包括如下步骤:S1,根据遗传算法形成特定网络环境特征词的计算模型,用户形成特征词预测模型:其中,a1为简单特征词记录值;a2为词组特征词记录值;a3为句式特征词记录值;wa为特征词相关程度权重,pi为特征词动态变化趋势量;ri为特征词获取完成量;为特征词动态变化随机干扰分量,γ为平衡系数,m为正整数;S1-2,选择特征词网络预测模型:其中,b1为陌生网络特征词出现频率预测值;b2为熟悉网络特征词出现频率预测值;b3为二级域名网络特征词出现频率预测值;b4为一级域名网络特征词出现频率预测值;R为诊断周期分量;Vj为特征词出现率随机干扰分量,t为响应周期,为匹配偏差因子,μ为重合度消耗增量因子,β为网络延迟影响系数,Ψ为正态适度响应值,Aj为特征词出现次数动态预测值;S2,对于特征词分布考虑到各种特性之间的相关性,定义N为特征词匹配成功数据,L为特征词匹配未成功数据,M为未进行匹配的特征词数据,Sk为特征词种类分量,B为偏移值,为特征词匹配成功数据限制函数,为特征词匹配未成功数据限制函数,为未进...

【专利技术属性】
技术研发人员:刘玉蓉
申请(专利权)人:重庆市智权之路科技有限公司
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1