当前位置: 首页 > 专利查询>海南大学专利>正文

地理位置定位方法、系统、计算机设备和存储介质技术方案

技术编号:23605263 阅读:28 留言:0更新日期:2020-03-28 06:12
本发明专利技术涉及一种地理位置定位方法、系统、计算机设备和存储介质。方法包括:获取用户文本信息;对用户文本信息进行标注化处理,得到文本序列;提取文本序列中的提及标识符,根据提及标识符分析各用户之间的联系,构建用户的网络视图;对文本序列进行特征提取,得到用户的文本视图;将网络视图和文本视图输入至预先训练后的注意力神经网络模型,得到用户的位置预测数据信息;对位置预测数据信息进行解码,得到地理位置坐标数据。上述方法通过输入的用户文本信息,拟合用户文本中影响地理位置预测的不可见因素,使其能够对社交网络文本数据进行地理位置预测;并采用注意力神经网络模型对复杂的用户关系进行分析得到用户的位置信息,准确度高。

Geolocation methods, systems, computer equipment and storage media

【技术实现步骤摘要】
地理位置定位方法、系统、计算机设备和存储介质
本专利技术涉及位置分析
,特别是涉及一种地理位置定位方法、系统、计算机设备和存储介质。
技术介绍
随着社交网络媒体发展迅猛,网络用户数量不断增加,产生了规模庞大的数据,而面向这些数据产生了很多应用服务。然而,这些服务往往依托于较为精确的地理位置信息,相较于难以获取的第三方位置服务信息,通过分析易于获取的用户公开文本信息来进行有效的地理位置预测就显得十分重要。传统的地理位置预测方法大多基于单一的文本视图(Contentview)或单一的网络视图(Networkview),其利用的文本特征较为有限,且难以根据新用户的数据进行及时的分析和处理。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够解决问题的地理位置定位方法、系统、计算机设备和存储介质。一种地理位置定位方法,所述方法包括:获取用户文本信息;对所述用户文本信息进行标注化处理,得到文本序列;提取所述文本序列中的提及标识符,根据所述提及标识符分析各用户之间的联系,构建用户的网络视图;对所述文本序列进行特征提取,得到用户的文本视图;将所述网络视图和所述文本视图输入至预先训练后的注意力神经网络模型,得到用户的位置预测数据信息;对所述位置预测数据信息进行解码,得到所述地理位置坐标数据。在其中一个实施例中,所述文本序列为单词序列;对所述用户文本信息进行标注化处理,得到文本序列的步骤中,包括:当文本为英文文本时,将所有英文单词转化为小写单词,得到小写字母文本;去除所述小写字母文本中的停用词、统一资源定位符、表情符号和标点符号,并将单词中连续重复出现多次的字母降至两次,得到处理后的字母文本;将所述处理后的字母文本采用朴素贝叶斯法进行拼写检查;在拼写检查通过后的字母文本输入至波特词根提取模型,得到单词序列。在其中一个实施例中,所述文本序列为词组序列;对所述用户文本信息进行标注化处理,得到文本序列的步骤中,包括:当文本为中文文本时,对所述中文文本进行分词处理,得到分词文本;去除所述分词文本中的停用词、统一资源定位符、表情符号和标点符号,得到所述词组序列。在其中一个实施例中,提取所述文本序列中的提及标识符,根据所述提及标识符分析各用户之间的联系,构建用户的网络视图的步骤中,包括:去除重复的提及标识符;对当前用户以及所述当前用户使用的提及标识符所提及的用户进行关系融合,并根据融合后的关系构建图结构数据;根据所述图结构数据得到所述网络视图。在其中一个实施例中,对所述文本序列进行特征提取的步骤中,包括:对所述文本序列分别从词视角、句子视角和主题视角进行了特征提取。在其中一个实施例中,将所述网络视图和所述文本视图输入至预先训练后的注意力神经网络模型,得到用户的位置预测数据信息的步骤中,包括:对所述文本视图进行降维;根据降维后的文本视图和网络视图计算每个用户的注意力系数,得到自注意力系数和邻居注意力系数;根据所述自注意力系数和邻居注意力系数计算得到每个用户之间的注意力系数;将用户之间的注意力系数作为权重和每个用户的邻居特征进行加权求和,得到用户的特征;将所述用户的特征采用非线性函数进行输出,得到用户的位置预测数据信息。在其中一个实施例中,对所述位置预测数据信息进行解码,得到所述地理位置坐标数据的步骤中,包括:对所述位置预测数据信息进行解码,得到用户的预测标签;根据所述预测标签找到相应区域的经纬度坐标;根据所述经纬度坐标确定所述地理位置坐标数据。一种地理位置定位系统,所述系统包括:文本信息获取模块,用于获取用户文本信息;文本序列获得模块,用于对所述用户文本信息进行标注化处理,得到文本序列;网络视图构建模块,用于提取所述文本序列中的提及标识符,根据所述提及标识符分析各用户之间的联系,构建用户的网络视图;文本视图获得模块,用于对所述文本序列进行特征提取,得到用户的文本视图;位置数据预测模块,用于将所述网络视图和所述文本视图输入至预先训练后的注意力神经网络模型,得到用户的位置预测数据信息;解码模块,用于对所述位置预测数据信息进行解码,得到所述地理位置坐标数据。一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取用户文本信息;对所述用户文本信息进行标注化处理,得到文本序列;提取所述文本序列中的提及标识符,根据所述提及标识符分析各用户之间的联系,构建用户的网络视图;对所述文本序列进行特征提取,得到用户的文本视图;将所述网络视图和所述文本视图输入至预先训练后的注意力神经网络模型,得到用户的位置预测数据信息;对所述位置预测数据信息进行解码,得到所述地理位置坐标数据。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取用户文本信息;对所述用户文本信息进行标注化处理,得到文本序列;提取所述文本序列中的提及标识符,根据所述提及标识符分析各用户之间的联系,构建用户的网络视图;对所述文本序列进行特征提取,得到用户的文本视图;将所述网络视图和所述文本视图输入至预先训练后的注意力神经网络模型,得到用户的位置预测数据信息;对所述位置预测数据信息进行解码,得到所述地理位置坐标数据。上述地理位置定位方法、系统、计算机设备和存储介质,首选获取用户文本信息,对文本信息进行标准化处理,得到文本序列;然后对文本序列进行分析处理构建用户的网络视图和文本视图,再将网络视图和文本视图输入至注意力神经网络模型可以得到用户的位置预测数据信息,最后对位置预测数据信息进行分析即可确定地理位置坐标数据。上述地理位置定位方法通过输入的用户文本信息,拟合用户文本中影响地理位置预测的不可见因素,使其能够对真实的社交网络文本数据进行地理位置预测;并采用注意力神经网络模型可以对复杂的用户关系(即网络视图)进行分析,可以对用户的位置信息做出预测,准确度高。附图说明图1为一实施例地理位置定位方法应用环境的示意图;图2为一个实施例中地理位置定位方法的流程示意图;图3为另一个实施例中地理位置定位方法的流程示意图;图4为另一个实施例中地理位置定位方法的流程示意图;图5为另一个实施例中地理位置定位方法的流程示意图;图6为一实施例中地理位置定位系统的结构示意图;图7为一个实施例中计算机设备的内部结构图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本方法运用于本文档来自技高网...

【技术保护点】
1.一种地理位置定位方法,其特征在于,所述方法包括:/n获取用户文本信息;/n对所述用户文本信息进行标注化处理,得到文本序列;/n提取所述文本序列中的提及标识符,根据所述提及标识符分析各用户之间的联系,构建用户的网络视图;/n对所述文本序列进行特征提取,得到用户的文本视图;/n将所述网络视图和所述文本视图输入至预先训练后的注意力神经网络模型,得到用户的位置预测数据信息;/n对所述位置预测数据信息进行解码,得到所述地理位置坐标数据。/n

【技术特征摘要】
1.一种地理位置定位方法,其特征在于,所述方法包括:
获取用户文本信息;
对所述用户文本信息进行标注化处理,得到文本序列;
提取所述文本序列中的提及标识符,根据所述提及标识符分析各用户之间的联系,构建用户的网络视图;
对所述文本序列进行特征提取,得到用户的文本视图;
将所述网络视图和所述文本视图输入至预先训练后的注意力神经网络模型,得到用户的位置预测数据信息;
对所述位置预测数据信息进行解码,得到所述地理位置坐标数据。


2.根据权利要求1所述的地理位置定位方法,其特征在于,所述文本序列为单词序列;对所述用户文本信息进行标注化处理,得到文本序列的步骤中,包括:
当文本为英文文本时,将所有英文单词转化为小写单词,得到小写字母文本;
去除所述小写字母文本中的停用词、统一资源定位符、表情符号和标点符号,并将单词中连续重复出现多次的字母降至两次,得到处理后的字母文本;
将所述处理后的字母文本采用朴素贝叶斯法进行拼写检查;
在拼写检查通过后的字母文本输入至波特词根提取模型,得到单词序列。


3.根据权利要求1所述的地理位置定位方法,其特征在于,所述文本序列为词组序列;对所述用户文本信息进行标注化处理,得到文本序列的步骤中,包括:
当文本为中文文本时,对所述中文文本进行分词处理,得到分词文本;
去除所述分词文本中的停用词、统一资源定位符、表情符号和标点符号,得到所述词组序列。


4.根据权利要求3所述的地理位置定位方法,其特征在于,提取所述文本序列中的提及标识符,根据所述提及标识符分析各用户之间的联系,构建用户的网络视图的步骤中,包括:
去除重复的提及标识符;
对当前用户以及所述当前用户使用的提及标识符所提及的用户进行关系融合,并根据融合后的关系构建图结构数据;
根据所述图结构数据得到所述网络视图。


5.根据权利要求4所述的地理位置定位方法,其特征在于,对所述文本序列进行特征提取的步骤中,包括:
对所述文本序列分别从词视角、句子视角和主题视角进行了特征提取。
...

【专利技术属性】
技术研发人员:王湛宇叶春杨周辉
申请(专利权)人:海南大学
类型:发明
国别省市:海南;46

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1