基于大语言模型的社交媒体用户地理位置预测方法及装置制造方法及图纸

技术编号:43014077 阅读:32 留言:0更新日期:2024-10-18 17:18
本发明专利技术实施例中提供了一种基于大语言模型的社交媒体用户地理位置预测方法、装置及电子设备,属于数据处理技术领域,该方法包括:对收集到的社交媒体数据进行清洗和格式化处理,得到标准数据;利用大语言模型从标准数据的文本内容中提取显性地理特征集合GE和隐性地理特征集合;通过聚合度函数J,计算所述显性地理特征集合GE的聚合度值Jf;对隐性地理特征集合GY进行融合操作R(K,GY);通过计算函数GP、第一目标集合MF以及第二目标集合MS,确定社交媒体用户的地理位置LS=GP(MF,MS)。本发明专利技术能够提高社交媒体用户地理位置预测的准确性。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及一种基于大语言模型的社交媒体用户地理位置预测方法、装置及电子设备。


技术介绍

1、在社交媒体平台上,用户的地理位置信息通常是由用户自己选择分享的。这些信息可以用于各种目的,比如个性化广告、地理位置签到或与朋友和家人分享当前位置。

2、而用户在社交媒体上发布的内容,如果用户没有主动分享其位置信息,通常很难判断用户的位置信息,也就很难基于位置信息对社交媒体内容进行分类和管理,导致社交媒体内容管理上存在一定的困难。为此,需要设置预测算法,对社交媒体用户地理位置进行预测。

3、现有技术在社交媒体用户地理位置预测的过程中,存在如下问题:

4、1.依赖显性标签:现有算法主要依赖用户提供的显性地理标签,当这些标签缺失时,预测效果显著下降。

5、2.数据利用不足:对社交媒体文本中的隐性地理信息挖掘不足,未能充分利用自然语言处理技术进行位置预测。

6、3.模型性能限制:传统的地理位置预测模型在处理大规模、多样化的社交媒体数据时,性能和精度有限。

7、上述问题成为需要解决的本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的社交媒体用户地理位置预测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述从多个社交媒体平台收集用户发布的社交媒体数据,并对收集到的社交媒体数据进行清洗和格式化处理,得到标准数据,包括:

3.根据权利要求2所述的方法,其特征在于,所述利用大语言模型从标准数据的文本内容中提取显性地理特征集合GE={GE1,GE2,…GEn}和隐性地理特征集合GY={GY1,GY2,…GYm},包括:

4.根据权利要求3所述的方法,其特征在于,所述利用大语言模型从标准数据的文本内容中提取显性地理特征集合GE={GE1,GE2,...

【技术特征摘要】

1.一种基于大语言模型的社交媒体用户地理位置预测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述从多个社交媒体平台收集用户发布的社交媒体数据,并对收集到的社交媒体数据进行清洗和格式化处理,得到标准数据,包括:

3.根据权利要求2所述的方法,其特征在于,所述利用大语言模型从标准数据的文本内容中提取显性地理特征集合ge={ge1,ge2,…gen}和隐性地理特征集合gy={gy1,gy2,…gym},包括:

4.根据权利要求3所述的方法,其特征在于,所述利用大语言模型从标准数据的文本内容中提取显性地理特征集合ge={ge1,ge2,…gen}和隐性地理特征集合gy={gy1,gy2,…gym},还包括:

5.根据权利要求4所述的方法,其特征在于,所述对所述显性地理特征集合ge={ge1,g...

【专利技术属性】
技术研发人员:彭浩寇振芳李蕾苗宇张润林
申请(专利权)人:一网互通北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1