网络信息所属地域识别方法及装置制造方法及图纸

技术编号:15763307 阅读:281 留言:0更新日期:2017-07-06 00:45
本发明专利技术提供了一种网络信息所属地域识别方法及装置,通过获取网络信息中包含的地域集合;依据地域集合中每一地域在网络信息中出现的次数以及位置,确定每一地域相应的权重,权重用于表征网络信息所属地域为相应地域的概率。依据每一地域相应的权重,从地域名称集中,确定网络信息所属地域。从而在推送网络信息时,依据网络信息所属地域进行相应推送。例如,对宝安区的用户推送宝安区的网络信息。

Method and device for identifying region of network information

The invention provides a network information and device region identification method, by including access to network information in the region set; according to number of each region in the collection region appears in the network information and the location of each region to determine the corresponding weight, weight for characterization of network information of an area for the probability of the corresponding region the. According to the corresponding weight of each area, the region of the network information is determined from the geographical name concentration. Accordingly, when pushing network information, corresponding push is carried out according to the network information. For example, users in Baoan District push network information in Baoan District.

【技术实现步骤摘要】
网络信息所属地域识别方法及装置
本专利技术涉及通信
,更具体的涉及网络信息所属地域识别方法及装置。
技术介绍
随着因特网在全球范围内的飞速发展,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为信息主要载体之一,网络的传播特性使得海量的网络信息涌向用户。但用户还是更关注发生在身边的事情,因此如何能够准确的识别网络信息中的地域信息,显得尤为重要。
技术实现思路
有鉴于此,本专利技术提供了一种网络信息所属地域识别方法及装置,以克服现有技术中没有识别网络信息所属地域的问题。为实现上述目的,本专利技术提供如下技术方案:一种网络信息所属地域识别方法,包括:获取网络信息中包括的地域集合,所述地域集合包括至少一个地域;依据所述地域集合中每一地域在所述网络信息中出现的次数以及位置,确定每一地域相应的权重,权重用于表征所述网络信息所属地域为相应地域的概率;依据每一地域相应的权重,从所述地域名称集中,确定所述网络信息所属地域。其中,所述获取网络信息中包括的地域名称集包括:将所述网络信息进行划分,获得多个词;从所述多个词中,获得与预先存储的各地域相匹配的目标词;由所述目标词组成所述地域集合。其中,所述依据所述地域集合中每一地域在所述网络信息中出现的次数以及位置,确定每一地域相应的权重包括:判断所述地域集合中每一地域在所述网络信息中出现的位置;当所述地域集合中第一地域在所述网络信息中的标题位置时,依据第一函数计算所述第一地域的权重,所述第一函数以相应地域在所述标题中的位置为因变量,以权重为自变量的函数,且所述第一函数的自变量和因变量为负相关;当所述地域集合中第二地域在所述网络信息的正文中位置时,依据第二函数计算所述第二地域的权重,所述第二函数以相应地域在所述正文中的位置为因变量,以权重为自变量的函数,且所述第二函数的自变量和因变量为负相关。其中,所述依据所述地域集合中每一地域在所述网络信息中出现的次数以及位置,确定每一地域相应的权重,还包括:当所述地域集合中第三地域在所述网络信息中出现的次数大于等于两次时,将所述第三地域对应的各权重相加;将所述第三地域对应的各权重相加之和,确定为所述第三地域的权重。其中,所述依据每一地域相应的权重,从所述地域名称集中,确定所述网络信息所属地域包括:依据预先存储的用于表征各地域所属关系的上下级关系,判断所述地域集合中各地域之间是否具有上下级关系;当所述地域集合中至少两个地域之间具有上下级关系时,将所述至少两个地域确定为一细粒度地域;将所述至少两个地域相应的权重进行预设计算,获得所述细粒度地域相应的权重;依据所述地域集合中每一细粒度地域相应的权重,以及所述地域集合中与各地域都不具有上下级关系的粗粒度地域相应的权重,从所述地域集合包含的细粒度地域和粗粒度地域中,确定所述网络信息所属地域。其中,所述从所述地域集合包含的细粒度地域和粗粒度地域中,确定所述网络信息所属地域包括:判断所述地域集合包含的细粒度地域和粗粒度地域相应的权重与第一预设阈值的大小关系;当大于等于所述第一预设阈值的权重的个数为零个时,确定所述网络信息无所属地域;当大于等于所述第一预设阈值的权重的个数为至少一个时,将最大权重对应的目标地域,确定为所述网络信息所属地域属性,所述目标地域为细粒度地域或粗粒度地域。其中,所述当大于等于所述第一预设阈值的权重的个数为至少一个时,将最大权重对应的目标地域,确定为所述网络信息所属地域属性包括:当大于等于所述第一预设阈值的权重的个数为一个时,将大于等于所述第一预设阈值的权重相应的目标地域,确定为所述网络信息所属地域属性;当大于等于所述预设阈值的权重的个数为至少两个时,计算大于等于所述预设阈值的权重相应的至少两个目标地域中,每两个目标地域相应权重的差值;当至少一个差值大于等于第二预设阈值时,将最大权重对应的目标地域,确定为所述网络信息所属地域属性;当所有差值均小于所述第二预设阈值时,确定所述网络信息无所属地域。一种网络信息所属地域识别装置,包括:获取模块,用于获取网络信息中包括的地域集合,所述地域集合包括至少一个地域;第一确定模块,用于依据所述地域集合中每一地域在所述网络信息中出现的次数以及位置,确定每一地域相应的权重,权重用于表征所述网络信息所属地域为相应地域的概率;第二确定模块,用于依据每一地域相应的权重,从所述地域名称集中,确定所述网络信息所属地域。其中,所述第一确定模块包括:第一判断单元,用于判断每一地域在所述网络信息中出现的位置;第一计算单元,用于当所述地域集合中第一地域在所述网络信息中的标题位置时,依据第一函数计算所述第一地域的权重,所述第一函数以相应地域在所述标题中的位置为因变量,以权重为自变量的函数,且所述第一函数的自变量和因变量为负相关;第二计算单元,用于当所述地域集合中第二地域在所述网络信息的正文中位置时,依据第二函数计算所述第二地域的权重,所述第二函数以相应地域在所述正文中的位置为因变量,以权重为自变量的函数,且所述第二函数的自变量和因变量为负相关。其中,所述第二确定模块包括:第二判断单元,用于依据预先存储的用于表征各地域所属关系的上下级关系,判断所述地域集合中各地域之间是否具有上下级关系;第一确定单元,用于当所述地域集合中至少两个地域之间具有上下级关系时,将所述至少两个地域确定为一细粒度地域;获取单元,用于将所述至少两个地域相应的权重进行预设计算,获得所述细粒度地域相应的权重;第二确定单元,用于依据所述地域集合中每一细粒度地域相应的权重,以及所述地域集合中与各地域都不具有上下级关系的粗粒度地域相应的权重,从所述地域集合包含的细粒度地域和粗粒度地域中,确定所述网络信息所属地域。经由上述的技术方案可知,与现有技术相比,本专利技术实施例提供的网络信息所属地域识别方法中,通过获取网络信息中包含的地域集合;依据地域集合中每一地域在网络信息中出现的次数以及位置,确定每一地域相应的权重,权重用于表征网络信息所属地域为相应地域的概率。依据每一地域相应的权重,从地域名称集中,确定网络信息所属地域。从而在推送网络信息时,依据网络信息所属地域进行相应推送。例如,对宝安区的用户推送宝安区的网络信息。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例提供的一种网络信息所属地域识别方法的流程图;图2为本专利技术实施例提供的一种网络信息所属地域识别方法中依据所述地域集合中每一地域在所述网络信息中出现的次数以及位置,确定每一地域相应的权重的一种实现方式的方法流程示意图;图3为本专利技术实施例提供的地域树状结构的部分示意图;图4为本专利技术实施例提供的网络信息所属地域识别方法中依据每一地域相应的权重,从所述地域名称集中,确定所述网络信息所属地域的一种实现方式的方法流程示意图;图5为采用本专利技术实施例提供的网络信息所属地域识别方法识别各网络信息所属地域的示意图;图6为本专利技术实施例提供的网络信息所属地域识别装置的结构示意图;图7为本专利技术实施例提供的电子设备的结构示意图。具体实施方式下面将结本文档来自技高网...
网络信息所属地域识别方法及装置

【技术保护点】
一种网络信息所属地域识别方法,其特征在于,包括:获取网络信息中包括的地域集合,所述地域集合包括至少一个地域;依据所述地域集合中每一地域在所述网络信息中出现的次数以及位置,确定每一地域相应的权重,权重用于表征所述网络信息所属地域为相应地域的概率;依据每一地域相应的权重,从所述地域名称集中,确定所述网络信息所属地域。

【技术特征摘要】
1.一种网络信息所属地域识别方法,其特征在于,包括:获取网络信息中包括的地域集合,所述地域集合包括至少一个地域;依据所述地域集合中每一地域在所述网络信息中出现的次数以及位置,确定每一地域相应的权重,权重用于表征所述网络信息所属地域为相应地域的概率;依据每一地域相应的权重,从所述地域名称集中,确定所述网络信息所属地域。2.根据权利要求1所述网络信息所属地域识别方法,所述获取网络信息中包括的地域名称集包括:将所述网络信息进行划分,获得多个词;从所述多个词中,获得与预先存储的各地域相匹配的目标词;由所述目标词组成所述地域集合。3.根据权利要求1所述网络信息所属地域识别方法,其特征在于,所述依据所述地域集合中每一地域在所述网络信息中出现的次数以及位置,确定每一地域相应的权重包括:判断所述地域集合中每一地域在所述网络信息中出现的位置;当所述地域集合中第一地域在所述网络信息中的标题位置时,依据第一函数计算所述第一地域的权重,所述第一函数以相应地域在所述标题中的位置为因变量,以权重为自变量的函数,且所述第一函数的自变量和因变量为负相关;当所述地域集合中第二地域在所述网络信息的正文中位置时,依据第二函数计算所述第二地域的权重,所述第二函数以相应地域在所述正文中的位置为因变量,以权重为自变量的函数,且所述第二函数的自变量和因变量为负相关。4.根据权利要求3所述网络信息所属地域识别方法,其特征在于,所述依据所述地域集合中每一地域在所述网络信息中出现的次数以及位置,确定每一地域相应的权重,还包括:当所述地域集合中第三地域在所述网络信息中出现的次数大于等于两次时,将所述第三地域对应的各权重相加;将所述第三地域对应的各权重相加之和,确定为所述第三地域的权重。5.根据权利要求1至4任一所述网络信息所属地域识别方法,其特征在于,所述依据每一地域相应的权重,从所述地域名称集中,确定所述网络信息所属地域包括:依据预先存储的用于表征各地域所属关系的上下级关系,判断所述地域集合中各地域之间是否具有上下级关系;当所述地域集合中至少两个地域之间具有上下级关系时,将所述至少两个地域确定为一细粒度地域;将所述至少两个地域相应的权重进行预设计算,获得所述细粒度地域相应的权重;依据所述地域集合中每一细粒度地域相应的权重,以及所述地域集合中与各地域都不具有上下级关系的粗粒度地域相应的权重,从所述地域集合包含的细粒度地域和粗粒度地域中,确定所述网络信息所属地域。6.根据权利要求5所述网络信息所属地域识别方法,其特征在于,所述从所述地域集合包含的细粒度地域和粗粒度地域中,确定所述网络信息所属地域包括:判断所述地域集合包含的细粒度地域和粗粒度地域相应的权重与第一预设阈值的大小关系;当大于等于所述第一预设阈值的权重的个数为零个时,确...

【专利技术属性】
技术研发人员:安倩李永红张政勇
申请(专利权)人:北京搜狐新媒体信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1