一种基于人工智能的可视化数据分析系统及方法技术方案

技术编号:38904349 阅读:14 留言:0更新日期:2023-09-22 14:22
本发明专利技术公开了一种基于人工智能的可视化数据分析系统及方法,本申请涉及人工智能技术领域,所述方法包括以下步骤:S100:采集用户行为特征数据;S200:根据采集的用户行为特征数据计算出用户各项行为特征的加权值,判断所述用户各项行为特征的加权值是否在预设行为特征阈值范围内;S300:根据所述用户行为特征数据对应的标记标签以及用户行为特征向量,建立多用户匹配模型;S400:追踪用户日常浏览数据时的行为特征,根据当前操作用户与建立多用户匹配模型判断当前用户使用者身份,实现用户身份的转换;本发明专利技术提供的技术方案具有人物身份识别准确率高,并能够实现用户身份的切换。并能够实现用户身份的切换。并能够实现用户身份的切换。

【技术实现步骤摘要】
一种基于人工智能的可视化数据分析系统及方法


[0001]本专利技术涉及人工智能
,具体为一种基于人工智能的可视化数据分析系统及方法。

技术介绍

[0002]随着网络技术的快速发展迭代,进入微电影时代,移动时代,新媒体时代,通过种种因素共同作用下诞生了短视频,近年,我国各大互联网巨头纷纷在短视频行业发现商机,加大对短视频行业的投入,想要打造出自己的平台,对各个领域进行细分,打造出美食、游戏、摄影、美景等更具特色的内容,引起了广大人民的热爱狂潮。
[0003]短视频行业的快速普及,应该更加注重内容的质量,在生活中,经常会遇到以下情况:很多年幼的孩子的行为会表现得极具成人化,因为小孩子的模仿力是很强的,当父母在浏览短视频时,孩子拿到父母手机时同样会浏览父母偏爱的视频内容,由于视频内容的不确定性,对孩子的身心健康会有一定的风险。

技术实现思路

[0004]本专利技术的目的在于提供一种基于人工智能的可视化数据分析方法,以解决上述
技术介绍
中提出的问题。
[0005]为了解决上述技术问题,本专利技术提供如下技术方案:一种基于人工智能的可视化数据分析方法,可视化数据分析方法包括以下:
[0006]步骤S100:采集用户行为特征数据;
[0007]步骤S200:根据采集用户行为特征数据计算出用户各项行为特征的加权值,将用户各项行为特征的加权值与预设行为特征阈值对比,将用户各项行为特征的加权值超过预设行为特征阈值标记为成人标签,将用户行为特征数据低于预设行为特征阈值标记为儿童标签;的预设行为特征阈值是通过设定的特征阈值来判断用户应该被归类为成人或儿童;
[0008]步骤S300:根据用户行为特征数据对应的标记标签以及用户行为特征向量,建立多用户匹配模型;多用户匹配模型是指当采集到不同成人或儿童用户时的行为特征数据,通过计算用户行为特征向量与每个用户身份特征向量之间的余弦夹角来衡量用户匹配度;用户行为特征向量是指将用户行为数据转化为特征向量表示;用户身份特征向量是指将用户行为特征数据对应的标记标签转化为特征向量表示;
[0009]步骤S400:根据当前操作用户行为特征数据,计算出当前操作用户匹配度,与建立多用户匹配模型进行对比,判断当前用户使用者身份,实现用户身份的转换;
[0010]用户行为特征数据包括:观看视频时长、观看同一个视频的次数、在观看视频时点赞评论频繁程度、分享或转发视频的次数、搜索关键词等。
[0011]进一步的,步骤S100包括:
[0012]步骤S110:设置目标视频软件,每当检测到用户打开目标视频软件,对用户在单位时间内对各短视频内容产生的行为进行特征采集,并存储到用户行为特征数据库中;
[0013]步骤S120:对用户行为特征数据库中的用户行为特征数据进行筛选处理,过滤掉冗余的用户行为特征数据;
[0014]步骤S130:用户行为特征数据包括:根据单位时间内每个视频类型,统计用户浏览类型视频的个数,用户浏览同一视频的次数,浏览各短视频进行评论,点赞,分享次数,搜索同一类型关键词的数量。
[0015]进一步的,步骤S200包括:
[0016]步骤S210:记用户行为特征数据为X
n
,Xn内包括{x1,x2,...,x
n
},其中X表示行为特征类型,n表示行为特征类型总个数;
[0017]步骤S220:根据公式:zi=w1*x1+w2*x2+...+w
n
*x
n
+b计算用户各项行为特征的加权值,其中w1,w2,w3,...,w
n
表示的是每个特征对应的权值系数,b表示偏移系数,主要用来限制权值系数的大小,在用户操作阶段,i表示所属用户浏览过程中单位时间内产生的数据波动次数,Z表示视频i的各项特征的加权值,假设浏览过程中数据波动总次数为J,那么i∈[1,J],则z
i
表示用户各项特征的加权值,通过取z
i
的平均值,得出用户各项特征的加权值;
[0018]步骤S230:将用户各项行为特征的加权值与预设行为特征阈值进行对比,当用户各项行为特征的加权值超过预设行为特征阈值标记为用户行为特征正常标签,当用户各项行为特征的加权值低于预设行为特征阈值标记为用户行为特征异常标签;
[0019]步骤S240:对上述的行为特征数据进行标记,将用户行为特征正常标签标记为成人标签,将用户行为特征异常标签标记为儿童标签。
[0020]进一步的,步骤S300包括:
[0021]步骤S310:记用户行为特征向量为一个长度为N的二进制向量,当用户出现用户行为特征时,记为1,其余特征位置记为0;
[0022]步骤S320:记用户身份特征向量为一个长度为M的二进制向量,当用户出现用户行为特征数据对应的标记标签,记为1,其余特征位置记为0;
[0023]步骤S330:通过公式计算:用户匹配度=dot_product(A,B)/(||A||*||B||),A和B分别表示用户行为特征向量和用户身份特征向量,dot_product(A,B)表示向量A和向量B的点积,点积表示将对应位置的元素相乘并相加得到的结果,||A||表示A的范数,即表示向量A的大小,||B||表示B的范数,即表示向量B的大小。
[0024]进一步的,步骤S400包括:
[0025]步骤S410:采集当前用户行为特征数据;
[0026]步骤S420:根据当前用户行为特征数据,计算出当前用户各项行为特征的加权值;
[0027]步骤S430:根据当前用户各项行为特征的加权值,通过用户匹配度公式计算出当前用户匹配度;
[0028]步骤S440:将当前用户匹配度与建立多用户匹配模型中的匹配度进行对比,当当前用户匹配度与建立多用户匹配模型中的匹配度作差运算,当差值在所设定的阈值范围内,则表示当前用户与建立多用户匹配模型中的用户身份相匹配;
[0029]步骤S450:将当前用户身份切换为建立多用户匹配模型中身份相匹配的用户。
[0030]进一步的,为更好的实现上述方法还提出了基于人工智能的可视化数据分析系统,可视化数据分析系统包括:数据采集模块、数据分析模块、数据建模模块、数据展示模块,
[0031]数据采集模块,用于获取用户行为信息,并存储到用户行为特征数据库中;
[0032]数据分析模块,判断用户行为特征数据是否在预设行为特征阈值范围内,将用户行为特征数据在预设行为特征阈值范围内标记为正常标签,将用户行为特征数据超过预设行为特征阈值范围标记为异常标签;
[0033]数据建模模块,用于对用户行为特征数据以及预设行为特征数据形成个性化用户行为特征模型;
[0034]数据展示模块,用于追踪当前用户行为特征数据,确认当前用户使用者身份,实现用户身份的转换。
[0035]进一步的,数据采集模块包括采集单元,分类单元,
[0036]采集单元,用于获取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的可视化数据分析方法,其特征在于,所述方法包括以下步骤:步骤S100:采集用户行为特征数据;步骤S200:根据采集的用户行为特征数据计算出用户各项行为特征的加权值,将所述用户各项行为特征的加权值与预设行为特征阈值对比,将所述用户各项行为特征的加权值超过预设行为特征阈值标记为第一标签,将所述用户行为特征数据低于预设行为特征阈值标记为第二标签;所述的预设行为特征阈值是通过设定的特征阈值来判断用户类别;步骤S300:根据所述用户行为特征数据对应的标记标签以及用户行为特征向量,建立多用户匹配模型;所述多用户匹配模型是指当采集到不同类型的用户时的行为特征数据,通过计算用户行为特征向量与每个用户身份特征向量之间的余弦夹角来衡量用户匹配度;所述用户行为特征向量是指将用户行为数据转化为特征向量表示;所述用户身份特征向量是指将所述用户行为特征数据对应的标记标签转化为特征向量表示;步骤S400:根据当前操作用户行为特征数据,计算出当前操作用户匹配度,与建立多用户匹配模型进行对比,判断当前用户使用者身份,实现用户身份的转换。2.根据权利要求1所述的一种基于人工智能的可视化数据分析方法,其特征在于,所述步骤S100包括:步骤S110:设置目标软件,每当检测到所述用户打开所述目标软件,对用户在单位时间内对各软件内容产生的行为进行特征采集,并存储到用户行为特征数据库中;步骤S120:对用户行为特征数据库中的所述用户行为特征数据进行筛选处理,过滤掉冗余的所述用户行为特征数据;步骤S130:所述用户行为特征数据包括:根据单位时间内每个内容类型,统计所述用户浏览所述类型内容的个数,所述用户浏览同一内容的次数、浏览各内容进行评论、点赞、分享次数、搜索同一类型关键词的数量。3.根据权利要求2所述的一种基于人工智能的可视化数据分析方法,其特征在于,所述步骤S200包括:步骤S210:记用户行为特征数据为X
n
,所述X
n
内包括{x1,x2,...,x
n
},其中X表示行为特征类型,n表示行为特征类型总个数;步骤S220:根据公式:z
i
=w1*x1+w2*x2+...+w
n
*x
n
+b计算用户各项行为特征的加权值,其中w1,w2,w3,...,w
n
表示的是每个特征对应的权值系数,b表示偏移系数,主要用来限制权值系数的大小,在用户操作阶段,i表示所属用户浏览过程中单位时间内产生的数据波动次数,Z表示视频i的各项特征的加权值,假设浏览过程中数据波动总次数为J,那么i∈[1,J],则z
i
表示用户各项特征的加权值,通过取z
i
的平均值,得出用户各项特征的加权值;步骤S230:将所述用户各项行为特征的加权值与预设行为特征阈值进行对比,当所述用户各项行为特征的加权值超过预设行为特征阈值标记为用户行为特征正常标签,当所述用户各项行为特征的加权值低于预设行为特征阈值标记为用户行为特征异常标签;步骤S240:对上述的行为特征数据进行标记,将所述用户行为特征正常标签标记为第一标签,将所述用户行为特征异常标签标记为第二标签。4.根据权利要求3所述的一种基于人工智能的可视化数据分析方法,其特征在于,所述步骤S3...

【专利技术属性】
技术研发人员:韩恒科韩继明
申请(专利权)人:大庆市鑫海天网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1