网络行为数据的处理方法、装置和设备制造方法及图纸

技术编号:38421615 阅读:20 留言:0更新日期:2023-08-07 11:21
本公开提供了一种网络行为数据的处理方法、装置和设备,本公开涉及人工智能领域,具体涉及自然语言处理、深度学习技术等,可应用在智慧政务场景下。具体实现方案为:获取具有目标意图的多个用户标识各自对应的网络行为序列;针对每个用户标识,对用户标识对应的网络行为序列进行聚类处理,以得到用户标识对应的行为簇;对所有用户标识对应的行为簇进行聚类处理,以得到多个聚类集合;从多个聚类集合中确定出与目标意图有关的目标聚类集合。由此,提出了一种通过对具有目标意图的多个用户标识各自对应的网络行为序列进行挖掘,以得到与目标意图有关的行为数据的方式,准确确定出了与意图有关的行为级别上的数据。与意图有关的行为级别上的数据。与意图有关的行为级别上的数据。

【技术实现步骤摘要】
网络行为数据的处理方法、装置和设备


[0001]本公开涉及人工智能领域,具体涉及自然语言处理、深度学习技术等,可应用在智慧政务场景下,尤其涉及网络行为数据的处理方法、装置和设备。

技术介绍

[0002]目前,在海量的网络行为数据,如何快速挖掘出与目标意图(例如写作意图)相关的行为数据,对于后续基于挖掘出的与目标意图相关的行为数据,来确定待评估用户是否具有该目标意图是十分重要的。

技术实现思路

[0003]本公开提供了一种用于网络行为数据的处理方法、装置和设备。
[0004]根据本公开的一方面,提供了一种网络行为数据的处理方法,包括:获取具有目标意图的多个用户标识各自对应的网络行为序列;针对每个用户标识,对所述用户标识对应的网络行为序列进行聚类处理,以得到所述用户标识对应的行为簇;对所有所述用户标识对应的行为簇进行聚类处理,以得到多个聚类集合;从所述多个聚类集合中确定出与所述目标意图有关的目标聚类集合。
[0005]根据本公开的另一方面,提供了一种网络行为数据的处理装置,包括:获取模块,用于获取具有目标意图的多个用本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种网络行为数据的处理方法,包括:获取具有目标意图的多个用户标识各自对应的网络行为序列;针对每个用户标识,对所述用户标识对应的网络行为序列进行聚类处理,以得到所述用户标识对应的行为簇;对所有所述用户标识对应的行为簇进行聚类处理,以得到多个聚类集合;从所述多个聚类集合中确定出与所述目标意图有关的目标聚类集合。2.根据权利要求1所述的方法,其中,所述网络行为序列包括按照时间顺序排列的N个网络行为文本数据,其中,N为大于1的整数,所述针对每个用户标识,对所述用户标识对应的网络行为序列进行聚类处理,以得到所述用户标识对应的行为簇,包括:针对每个用户标识,根据所述用户标识所对应的网络行为序列,生成所述用户标识所对应的行为子簇序列,其中,所述行为子簇序列中的每个行为子簇包含一个网络行为文本数据;将所述行为子簇序列中第i个行为子簇作为中间行为子簇,其中,i的初始值为1;确定所述中间行为子簇与所述行为子簇序列中第i+1个行为子簇之间的相似度;在所述相似度大于或者等于预设相似度阈值的情况下,将所述第i+1个行为子簇添加到所述中间行为子簇中;在所述相似度小于预设相似度阈值,并且所述中间行为子簇中行为子簇的数量大于1的情况下,将所述中间行为子簇作为所述行为簇;在所述相似度小于预设相似度阈值,并且所述中间行为子簇中行为子簇的数量等于1的情况下,将所述第i+1个行为子簇作为所述中间行为子簇;在所述i小于N

1的情况下,对所述i进行加1处理,并跳转至确定所述中间行为簇与所述行为子簇序列中第i+1个行为子簇之间的相似度的步骤;在所述i等于N

1的情况下,将当前所得到的中间行为子簇作为所述行为簇。3.根据权利要求2所述的方法,其中,所述方法还包括:将所述行为子簇序列中未添加到任何中间行为子簇中的行为子簇作为所述行为簇。4.根据权利要求1所述的方法,其中,所述对所有所述用户标识对应的行为簇进行聚类处理,以得到多个聚类集合,包括:对所有所述用户标识对应的行为簇进行聚合处理,以得到聚合处理结果;确定所述聚合处理结果中各个行为簇之间的相似度;根据所述聚合处理结果中各个行为簇之间的相似度,对所述聚合处理结果中的行为簇进行聚类,以得到多个聚类集合。5.根据权利要求1所述的方法,其中,所述从所述多个聚类集合中确定出与所述目标意图有关的目标聚类集合,包括:确定所述多个聚类集合各自对应的用户关注度;按照所述用户关注度从高到低的顺序,对所述多个聚类集合进行排序处理,以得到排序结果;将所述排序结果中排序在前M位的聚类集合作为与所述目标意图有关的目标聚类集合,其中,M为大于或者等于1的整数。6.根据权利要求5所述的方法,其中,所述确定所述多个聚类集合各自对应的用户关注
度,包括:针对每个聚类集合,确定所述聚类集合中行为簇的总数;根据所述聚类集合中行为簇的总数,确定所述聚类集合对应的用户关注度。7.根据权利要求5所述的方法,其中,所述确定所述多个聚类集合各自对应的用户关注度,包括:针对每个聚类集合,确定所述聚类集合中网络行为数据的总数;根据所述聚类集合中网络行为数据的总数,确定所述聚类集合对应的用户关注度。8.一种网络行为数据的处理装置,包括:获取模块,用于获取具有目标意图的多个用户标识各自对应的网络行为序列;第一聚类模块,用于针对每个用户标识,对所述用户标识对应的网络行为序列进行聚类处理,以得到所述用户标识对应的行为簇;第二聚类模块,用于对所有所述...

【专利技术属性】
技术研发人员:陈佳颖谢奕陈珺仪
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1