【技术实现步骤摘要】
基于深度学习的大数据用户需求识别方法
[0001]本专利技术涉及大数据
,更具体地说,本专利技术涉及基于深度学习的大数据用户需求识别方法
。
技术介绍
[0002]随着互联网和移动技术的快速发展,人们在日常生活中产生了大量的数据,呈现出多样性
、
复杂性和实时性,用户对于个性化服务和定制化推荐的需求越来越强烈
。
[0003]传统的用户需求识别方法需要手动设计和定义一系列的规则描述和识别用户需求,对于复杂
、
多样化的用户需求难以完全覆盖,并且需要不断更新和调整,对大规模数据和快速变化的用户需求时存在局限性,使用基于统计学和浅层机器学习算法的特征表示,难以捕捉到数据中的高级特征和语义信息,无法保证用户数据的保密性
。
技术实现思路
[0004]为了克服现有技术的上述缺陷,本专利技术的实施例提供基于深度学习的大数据用户需求识别方法,通过定向爬取互联网用户需求相关数据,以解决上述
技术介绍
中提出的问题
。
[0005]为实现上述目 ...
【技术保护点】
【技术特征摘要】
1.
基于深度学习的大数据用户需求识别方法,其特征在于:具体包括以下步骤:
101、
利用
URL
排序算法根据用户需求和偏好排序
URL
,定向爬取互联网收集用户需求相关数据,调用
API
接口获取特定用户及主题的数据,利用包含用户行为轨迹和偏好信息的日志文件获取用户关键行为数据;
102、
计算数据均值和标准差对数据进行清洗,去除数据中异常和重复的需求数据记录,选择
AES
对称加密算法以及脱敏操作保护用户隐私,利用泛化操作减少数据敏感程度;
103、
通过卷积神经网络模型处理用户图像数据,通过多次卷积和池化操作,保留最显著特征,通过循环神经网络模型,根据当前输入和前一个时间步的隐藏状态计算得到新的隐藏状态,通过隐藏状态的演化提取出序列数据中的特征;
104、
通过遗忘门
、
输入门以及输出门三种关键门组成门控机制,选择性存储和遗忘先前的数据信息,将多个长短期记忆网络层组成长短期记忆网络模型;
105、
利用特征提取的两种神经网络实现模态编码器,融合不同模态的编码特征,使用全连接层实现融合表示学习,对融合后的特征进一步学习和表示
。2.
根据权利要求1所述的基于深度学习的大数据用户需求识别方法,其特征在于:所述步骤
101
中,利用定向爬取互联网用户需求相关数据
、
调用特定
API
接口以及日志文件获取用户关键数据,利用计算权重值根据用户的需求和偏好排序
URL
,所述计算权重值具体公式为:其中
W
i
表示指标的权重,
x
i
表示不同的评估数据指标,
S
表示排序分数
。3.
根据权利要求1所述的基于深度学习的大数据用户需求识别方法,其特征在于:所述步骤
102
中,计算数据均值和标准差对数据进行清洗,进行数值特征归一化,选择
AES
对称加密算法以及脱敏操作保护用户隐私,利用泛化操作减少数据敏感程度,所述计算数据均值和标准差具体公式为:和标准差具体公式为:其中
n
表示数据个数,
S
表示数据样本均值,
C
表示数据样本标准差值,最大最小归一化具体公式为:其中
Z
表示归一化后的数据,
x
表示原始数据,
x
min
表示原始数据的最小值,
x
max
表示原始数据的最大值,所述加密算法具体公式为:
C
=
E(K,P)
其中
C
表示密文,
K
表示密钥,
P
表示明文,
E(X)
表示加密函数
。4.
根据权利要求1所述的基于深度学习的大数据用户需求识别方法,其特征在于:所述步骤
103
中,建立卷积神经网络模型和循环神经网络模型,通过多次卷积池化操作以及隐藏
状态的演化,提取数据特征,所述卷积运算公式为:其中
η
k
表示卷积层,
k
表示卷积核的个数,表示卷积核参数,
θ
表示偏置参数,
x
表示卷积,
λ
...
【专利技术属性】
技术研发人员:马骏,
申请(专利权)人:芜湖诺山信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。