【技术实现步骤摘要】
一种基于多元NLP的社交平台账号数据关联性分析方法
[0001]本专利技术涉及数据关联性分析领域,具体涉及一种基于多元
NLP
的社交平台账号数据关联性分析方法
。
技术介绍
[0002]自然语言处理(
Natural Language Processing
,
NLP
)是计算机科学领域与人工智能领域中的一个重要方向
。
它研究人与计算机之间用自然语言进行有效通信的理论和方法
。
融语言学
、
计算机科学
、
数学等于一体的科学
。
旨在从文本数据中提取信息
。
目的是让计算机处理或“理解”自然语言,以执行自动翻译
、
文本分类和情感分析等
。
[0003]随着互联网的普及和发展,在网络上会有各种各样的组织的社交媒体帐号在发表言论,然而我们无法将这些组织的社交媒体账号关联到每个组织成员
。
一些不法分子通过在网络上利用组织帐号宣传引导不良言论,通过多元
NLP
技术分析,对社交言论的文本数据进行语言分析,根据组织言论
、
个人言论的基本特征和细节特征进行聚合分析,将组织与个人进行关联,从而将组织和人物关系进行关联,但现有方案中对于
NLP
的使用过于单薄,不够立体,因此,加强网络安全监管和技术研发成为当前互联网发展的重要任务之一
。
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.
一种基于多元
NLP
的社交平台账号数据关联性分析方法,其特征在于,包括:
S1、
获取社交平台的账号数据建立关联账号多级数据;
S2、
利用所述关联账号多级数据基于多元
NLP
得到关联账号多级数据特征;
S3、
利用所述关联账号多级数据特征建立关联性筛选模型;
S4、
根据所述关联性筛选模型得到社交平台账号数据关联性分析结果
。2.
如权利要求1所述的一种基于多元
NLP
的社交平台账号数据关联性分析方法,其特征在于,所述获取社交平台的账号数据建立关联账号多级数据包括:
S1
‑
1、
获取社交平台的非个人账号对应言论数据与图片数据作为一级数据;
S1
‑
2、
判断当前社交平台的非个人账号是否存在个人账号交互行为,若是,则获取个人账号对应言论数据与图片数据作为二级数据,并执行
S1
‑3,否则,利用所述一级数据作为关联账号多级数据;
S1
‑
3、
利用所述一级数据与二级数据作为关联账号多级数据
。3.
如权利要求2所述的一种基于多元
NLP
的社交平台账号数据关联性分析方法,其特征在于,利用所述关联账号多级数据基于多元
NLP
得到关联账号多级数据特征包括:
S2
‑
1、
利用所述关联账号多级数据的言论数据基于
NLP
得到简要词汇数据;
S2
‑
2、
利用所述关联账号多级数据的图片数据得到图片文字提要数据;
S2
‑
3、
利用所述简要词汇数据与图片文字提要数据基于多元
NLP
建立数据链式映射;
S2
‑
4、
利用所述数据链式映射作为关联账号多级数据特征
。4.
如权利要求3所述的一种基于多元
NLP
的社交平台账号数据关联性分析方法,其特征在于,利用所述关联账号多级数据的言论数据基于
NLP
得到简要词汇数据包括:判断所述关联账号多级数据是否仅存在一级数据,若是,则利用所述关联账号多级数据的言论数据进行分词处理得到基础简要词汇数据,否则,利用所述关联账号多级数据的言论数据根据一级数据与二级数据分别进行分词处理得到一级数据对应基础简要词汇数据与二级数据对应基础简要词汇数据;利用所述基础简要词汇数据获取基础简要词汇数据向量;利用所述基础简要词汇数据向量基于隐马尔科夫模型得到基础简要词汇数据向量对应特征作为简要词汇数据
。5.
如权利要求3所述的一种基于多元
NLP
的社交平台账号数据关联性分析方法,其特征在于,利用所述关联账号多级数据的图片数据得到图片文字提要数据包括:利用所述关联账号多级数据的图片数据基于
OCR
文字识别技术得到初始提取文字数据;利用所述关联账号多级数据的图片数据与其对应初始提取文字数据建立图片
‑
文字映射;判断所述图片
‑
文字映射中是否存在相异情况,若是,则利用所述图片
‑
文字映射作为图片文字提要数据,否则,去除存在相异情况的图片
‑
文字映射后,利用所述图片
‑
文字映射作为图片文字提要数据;其中,所述相异情况为图片数据的内容与初始提取文字数据不对应
。6.
如权利要求3所述的一种基于多元
NLP
的社交平台账号数据关联性分析方法,其特征在于,利用所述简要词汇数据与图片文字提要数据基于多元
NLP
建立数据链式映射包括:
S2
‑3‑
1、
判断所述关联账号多级数据是否仅对应一级数据,若是,则直接执行
S2
‑3‑3,否则,执行
S2
‑3‑2;
S2
‑3‑
2、
判断所述关联账号多级数据中一级数据的言论数据与二级数据的言论数据是否对应,若是,则执行
【专利技术属性】
技术研发人员:王巍,张昊,赵志庆,侯玉柱,董席峰,张雨铭威,
申请(专利权)人:戎行技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。