通过大数据网络进行英语远程数据提取方法技术

技术编号:33455910 阅读:39 留言:0更新日期:2022-05-19 00:38
本发明专利技术提出了一种通过大数据网络进行英语远程数据提取方法,包括如下步骤:S1,获取大数据网络中每个节点的英语文献,对每个英语文献进行关联权重计算,通过聚合公式对英语文献进行遍历操作;通过归一化进行英语文献数据的统一;S2,对归一化的英语文献数据进行特征分类,通过特征分类器进行英语文献特征分类,完成英语文献的特征分类分析;S3,分类完成后对大数据网络中的每个英语文献进行标签化处理。大数据网络中的每个英语文献进行标签化处理。大数据网络中的每个英语文献进行标签化处理。

【技术实现步骤摘要】
通过大数据网络进行英语远程数据提取方法


[0001]本专利技术涉及数据分析领域,尤其涉及一种通过大数据网络进行英语远程数据提取方法。

技术介绍

[0002]在大数据网络中,网络媒介包含了大量英语文献以及英语相关词汇,对于英语词汇或者文献的内容中表达的引导性和指向性词语进行快速提取,是需要经过不断训练和学习的过程才能够实现快速查找对应的英语文献,现有的学习方法并不能对网络中英语文献进行标签化,也不能快速准确的进行分类操作,无法提取出所需的英语文献,降低了用户在对网络数据挖掘过程中的效率,无法匹配准确的英语文献,这就亟需本领域技术人员解决相应的技术问题。

技术实现思路

[0003]本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种通过大数据网络进行英语远程数据提取方法。
[0004]为了实现本专利技术的上述目的,本专利技术提供了一种通过大数据网络进行英语远程数据提取方法,包括:
[0005]S1,获取大数据网络中每个节点的英语文献,对每个英语文献进行关联权重计算,通过聚合公式对英语文献进行遍历操作;本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种通过大数据网络进行英语远程数据提取方法,其特征在于,包括:S1,获取大数据网络中每个节点的英语文献,对每个英语文献进行关联权重计算,通过聚合公式对英语文献进行遍历操作;通过归一化进行英语文献数据的统一;S2,对归一化的英语文献数据进行特征分类,通过特征分类器进行英语文献特征分类,完成英语文献的特征分类分析;S3,分类完成后对大数据网络中的每个英语文献进行标签化处理。2.根据权利要求1所述的通过大数据网络进行英语远程数据提取方法,其特征在于,所述S1包括:S1

1,在大数据网络中获取特定节点的英语文献,也就是在大数据网络中一个网络节点判断其是否存在英语文献,存在英语文献则保留该网络节点,不存在英语文献则删除该网络节点;S1

2,存在英语文献的网络节点接收检索信息的输入,根据检索信息关联度高低使用关联度权重进行数据赋值。3.根据权利要求2所述的通过大数据网络进行英语远程数据提取方法,其特征在于,所述S1还包括:S1

3,对r个英语文献包含的检索信息中形成信息集合Z
r
,i∈Z
r
,i为关联矩阵中包含的英语文献;通过r个英语文献中包含相同检索信息的关联权重对获取的英语文献y在关联向量中计算y
i
∈D
r
的关联程度;在关联权重乘以关联向量进行数据聚合,其中,σ是多个英语文献中包含相同检索信息的出现频次,ρ≠1,其为调节系数,用于对获取包含检索信息的英语文献出现频次进行收敛,m
n
为一个英语文献y出现n个检索信息的数量。4.根据权利要求3所述的通过大数据网络进行英语远程数据提取方法,其特征在于,所述S1还包括:S1

4,形成的归一化函数公式为:其中L(i)=L(Z
r
),用于计算聚合函数;该聚合函数为其中,为归一化之前包含检索信息的英语文献的平均...

【专利技术属性】
技术研发人员:邓淄予
申请(专利权)人:重庆工业职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1