一种基于多元制造技术

技术编号:39576454 阅读:6 留言:0更新日期:2023-12-03 19:27
本发明专利技术涉及数据关联性分析领域,尤其涉及一种基于多元

【技术实现步骤摘要】
一种基于多元NLP的社交平台账号数据关联性分析方法


[0001]本专利技术涉及数据关联性分析领域,具体涉及一种基于多元
NLP
的社交平台账号数据关联性分析方法


技术介绍

[0002]自然语言处理(
Natural Language Processing

NLP
)是计算机科学领域与人工智能领域中的一个重要方向

它研究人与计算机之间用自然语言进行有效通信的理论和方法

融语言学

计算机科学

数学等于一体的科学

旨在从文本数据中提取信息

目的是让计算机处理或“理解”自然语言,以执行自动翻译

文本分类和情感分析等

[0003]随着互联网的普及和发展,在网络上会有各种各样的组织的社交媒体帐号在发表言论,然而我们无法将这些组织的社交媒体账号关联到每个组织成员

一些不法分子通过在网络上利用组织帐号宣传引导不良言论,通过多元
NLP
技术分析,对社交言论的文本数据进行语言分析,根据组织言论

个人言论的基本特征和细节特征进行聚合分析,将组织与个人进行关联,从而将组织和人物关系进行关联,但现有方案中对于
NLP
的使用过于单薄,不够立体,因此,加强网络安全监管和技术研发成为当前互联网发展的重要任务之一


技术实现思路

[0004]针对现有技术的不足,本专利技术提供了一种基于多元
NLP
的社交平台账号数据关联性分析方法,通过
NLP
的多元应用与神经网络特征分类结合,提升社交平台中账号与虚拟数据关联性分析准确率

[0005]为实现上述目的,本专利技术提供了一种基于多元
NLP
的社交平台账号数据关联性分析方法,包括:
S1、
获取社交平台的账号数据建立关联账号多级数据;
S2、
利用所述关联账号多级数据基于多元
NLP
得到关联账号多级数据特征;
S3、
利用所述关联账号多级数据特征建立关联性筛选模型;
S4、
根据所述关联性筛选模型得到社交平台账号数据关联性分析结果

[0006]优选的,所述获取社交平台的账号数据建立关联账号多级数据包括:
S1

1、
获取社交平台的非个人账号对应言论数据与图片数据作为一级数据;
S1

2、
判断当前社交平台的非个人账号是否存在个人账号交互行为,若是,则获取个人账号对应言论数据与图片数据作为二级数据,并执行
S1
‑3,否则,利用所述一级数据作为关联账号多级数据;
S1

3、
利用所述一级数据与二级数据作为关联账号多级数据

[0007]进一步的,利用所述关联账号多级数据基于多元
NLP
得到关联账号多级数据特征包括:
S2

1、
利用所述关联账号多级数据的言论数据基于
NLP
得到简要词汇数据;
S2

2、
利用所述关联账号多级数据的图片数据得到图片文字提要数据;
S2

3、
利用所述简要词汇数据与图片文字提要数据基于多元
NLP
建立数据链式映射;
S2

4、
利用所述数据链式映射作为关联账号多级数据特征

[0008]进一步的,利用所述关联账号多级数据的言论数据基于
NLP
得到简要词汇数据包括:判断所述关联账号多级数据是否仅存在一级数据,若是,则利用所述关联账号多级数据的言论数据进行分词处理得到基础简要词汇数据,否则,利用所述关联账号多级数据的言论数据根据一级数据与二级数据分别进行分词处理得到一级数据对应基础简要词汇数据与二级数据对应基础简要词汇数据;利用所述基础简要词汇数据获取基础简要词汇数据向量;利用所述基础简要词汇数据向量基于隐马尔科夫模型得到基础简要词汇数据向量对应特征作为简要词汇数据

[0009]进一步的,利用所述关联账号多级数据的图片数据得到图片文字提要数据包括:利用所述关联账号多级数据的图片数据基于
OCR
文字识别技术得到初始提取文字数据;利用所述关联账号多级数据的图片数据与其对应初始提取文字数据建立图片

文字映射;判断所述图片

文字映射中是否存在相异情况,若是,则利用所述图片

文字映射作为图片文字提要数据,否则,去除存在相异情况的图片

文字映射后,利用所述图片

文字映射作为图片文字提要数据;其中,所述相异情况为图片数据的内容与初始提取文字数据不对应

[0010]进一步的,利用所述简要词汇数据与图片文字提要数据基于多元
NLP
建立数据链式映射包括:
S2
‑3‑
1、
判断所述关联账号多级数据是否仅对应一级数据,若是,则直接执行
S2
‑3‑3,否则,执行
S2
‑3‑2;
S2
‑3‑
2、
判断所述关联账号多级数据中一级数据的言论数据与二级数据的言论数据是否对应,若是,则执行
S2
‑3‑3,否则,返回
S1
‑2;
S2
‑3‑
3、
利用所述简要词汇数据进行停用词过滤处理后,基于
NLP
的词干提取得到简要词汇数据的词干提取数据;
S2
‑3‑
4、
利用所述图片文字提要数据进行停用词过滤处理后,基于
NLP
的词形还原得到图片文字提要数据的词形还原数据;
S2
‑3‑
5、
利用关联账号作为基准与词干提取数据

词形还原数据顺序建立数据链式映射

[0011]进一步的,利用所述关联账号多级数据特征建立关联性筛选模型包括:
S3

1、
获取所述关联账号多级数据的简要词汇数据与图片文字提要数据的词向量相似度;
S3

2、
利用所述关联账号多级数据特征的数据链式映射根据所述词向量相似度分别建立一类关联性筛选模型与二类关联性筛选模型;
S3

3、
利用所述一类关联性筛选模型与二类关联性筛选模型作为关联性筛选模


[0012]进一步的,利用所述关联账号多级数据特征的数据链式映射根据所述词本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于多元
NLP
的社交平台账号数据关联性分析方法,其特征在于,包括:
S1、
获取社交平台的账号数据建立关联账号多级数据;
S2、
利用所述关联账号多级数据基于多元
NLP
得到关联账号多级数据特征;
S3、
利用所述关联账号多级数据特征建立关联性筛选模型;
S4、
根据所述关联性筛选模型得到社交平台账号数据关联性分析结果
。2.
如权利要求1所述的一种基于多元
NLP
的社交平台账号数据关联性分析方法,其特征在于,所述获取社交平台的账号数据建立关联账号多级数据包括:
S1

1、
获取社交平台的非个人账号对应言论数据与图片数据作为一级数据;
S1

2、
判断当前社交平台的非个人账号是否存在个人账号交互行为,若是,则获取个人账号对应言论数据与图片数据作为二级数据,并执行
S1
‑3,否则,利用所述一级数据作为关联账号多级数据;
S1

3、
利用所述一级数据与二级数据作为关联账号多级数据
。3.
如权利要求2所述的一种基于多元
NLP
的社交平台账号数据关联性分析方法,其特征在于,利用所述关联账号多级数据基于多元
NLP
得到关联账号多级数据特征包括:
S2

1、
利用所述关联账号多级数据的言论数据基于
NLP
得到简要词汇数据;
S2

2、
利用所述关联账号多级数据的图片数据得到图片文字提要数据;
S2

3、
利用所述简要词汇数据与图片文字提要数据基于多元
NLP
建立数据链式映射;
S2

4、
利用所述数据链式映射作为关联账号多级数据特征
。4.
如权利要求3所述的一种基于多元
NLP
的社交平台账号数据关联性分析方法,其特征在于,利用所述关联账号多级数据的言论数据基于
NLP
得到简要词汇数据包括:判断所述关联账号多级数据是否仅存在一级数据,若是,则利用所述关联账号多级数据的言论数据进行分词处理得到基础简要词汇数据,否则,利用所述关联账号多级数据的言论数据根据一级数据与二级数据分别进行分词处理得到一级数据对应基础简要词汇数据与二级数据对应基础简要词汇数据;利用所述基础简要词汇数据获取基础简要词汇数据向量;利用所述基础简要词汇数据向量基于隐马尔科夫模型得到基础简要词汇数据向量对应特征作为简要词汇数据
。5.
如权利要求3所述的一种基于多元
NLP
的社交平台账号数据关联性分析方法,其特征在于,利用所述关联账号多级数据的图片数据得到图片文字提要数据包括:利用所述关联账号多级数据的图片数据基于
OCR
文字识别技术得到初始提取文字数据;利用所述关联账号多级数据的图片数据与其对应初始提取文字数据建立图片

文字映射;判断所述图片

文字映射中是否存在相异情况,若是,则利用所述图片

文字映射作为图片文字提要数据,否则,去除存在相异情况的图片

文字映射后,利用所述图片

文字映射作为图片文字提要数据;其中,所述相异情况为图片数据的内容与初始提取文字数据不对应
。6.
如权利要求3所述的一种基于多元
NLP
的社交平台账号数据关联性分析方法,其特征在于,利用所述简要词汇数据与图片文字提要数据基于多元
NLP
建立数据链式映射包括:
S2
‑3‑
1、
判断所述关联账号多级数据是否仅对应一级数据,若是,则直接执行
S2
‑3‑3,否则,执行
S2
‑3‑2;
S2
‑3‑
2、
判断所述关联账号多级数据中一级数据的言论数据与二级数据的言论数据是否对应,若是,则执行

【专利技术属性】
技术研发人员:王巍张昊赵志庆侯玉柱董席峰张雨铭威
申请(专利权)人:戎行技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1