The invention provides a network information and device region identification method, by including access to network information in the region set; according to number of each region in the collection region appears in the network information and the location of each region to determine the corresponding weight, weight for characterization of network information of an area for the probability of the corresponding region the. According to the corresponding weight of each area, the region of the network information is determined from the geographical name concentration. Accordingly, when pushing network information, corresponding push is carried out according to the network information. For example, users in Baoan District push network information in Baoan District.
【技术实现步骤摘要】
网络信息所属地域识别方法及装置
本专利技术涉及通信
,更具体的涉及网络信息所属地域识别方法及装置。
技术介绍
随着因特网在全球范围内的飞速发展,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为信息主要载体之一,网络的传播特性使得海量的网络信息涌向用户。但用户还是更关注发生在身边的事情,因此如何能够准确的识别网络信息中的地域信息,显得尤为重要。
技术实现思路
有鉴于此,本专利技术提供了一种网络信息所属地域识别方法及装置,以克服现有技术中没有识别网络信息所属地域的问题。为实现上述目的,本专利技术提供如下技术方案:一种网络信息所属地域识别方法,包括:获取网络信息中包括的地域集合,所述地域集合包括至少一个地域;依据所述地域集合中每一地域在所述网络信息中出现的次数以及位置,确定每一地域相应的权重,权重用于表征所述网络信息所属地域为相应地域的概率;依据每一地域相应的权重,从所述地域名称集中,确定所述网络信息所属地域。其中,所述获取网络信息中包括的地域名称集包括:将所述网络信息进行划分,获得多个词;从所述多个词中,获得与预先存储的各地域相匹配的目标词;由所述目标词组成所述地域集合。其中,所述依据所述地域集合中每一地域在所述网络信息中出现的次数以及位置,确定每一地域相应的权重包括:判断所述地域集合中每一地域在所述网络信息中出现的位置;当所述地域集合中第一地域在所述网络信息中的标题位置时,依据第一函数计算所述第一地域的权重,所述第一函数以相应地域在所述标题中的位置为因变量,以权重为自变量的函数,且所述第一函数的自变量和因变量为负相关;当所述地域集合中第二 ...
【技术保护点】
一种网络信息所属地域识别方法,其特征在于,包括:获取网络信息中包括的地域集合,所述地域集合包括至少一个地域;依据所述地域集合中每一地域在所述网络信息中出现的次数以及位置,确定每一地域相应的权重,权重用于表征所述网络信息所属地域为相应地域的概率;依据每一地域相应的权重,从所述地域名称集中,确定所述网络信息所属地域。
【技术特征摘要】
1.一种网络信息所属地域识别方法,其特征在于,包括:获取网络信息中包括的地域集合,所述地域集合包括至少一个地域;依据所述地域集合中每一地域在所述网络信息中出现的次数以及位置,确定每一地域相应的权重,权重用于表征所述网络信息所属地域为相应地域的概率;依据每一地域相应的权重,从所述地域名称集中,确定所述网络信息所属地域。2.根据权利要求1所述网络信息所属地域识别方法,所述获取网络信息中包括的地域名称集包括:将所述网络信息进行划分,获得多个词;从所述多个词中,获得与预先存储的各地域相匹配的目标词;由所述目标词组成所述地域集合。3.根据权利要求1所述网络信息所属地域识别方法,其特征在于,所述依据所述地域集合中每一地域在所述网络信息中出现的次数以及位置,确定每一地域相应的权重包括:判断所述地域集合中每一地域在所述网络信息中出现的位置;当所述地域集合中第一地域在所述网络信息中的标题位置时,依据第一函数计算所述第一地域的权重,所述第一函数以相应地域在所述标题中的位置为因变量,以权重为自变量的函数,且所述第一函数的自变量和因变量为负相关;当所述地域集合中第二地域在所述网络信息的正文中位置时,依据第二函数计算所述第二地域的权重,所述第二函数以相应地域在所述正文中的位置为因变量,以权重为自变量的函数,且所述第二函数的自变量和因变量为负相关。4.根据权利要求3所述网络信息所属地域识别方法,其特征在于,所述依据所述地域集合中每一地域在所述网络信息中出现的次数以及位置,确定每一地域相应的权重,还包括:当所述地域集合中第三地域在所述网络信息中出现的次数大于等于两次时,将所述第三地域对应的各权重相加;将所述第三地域对应的各权重相加之和,确定为所述第三地域的权重。5.根据权利要求1至4任一所述网络信息所属地域识别方法,其特征在于,所述依据每一地域相应的权重,从所述地域名称集中,确定所述网络信息所属地域包括:依据预先存储的用于表征各地域所属关系的上下级关系,判断所述地域集合中各地域之间是否具有上下级关系;当所述地域集合中至少两个地域之间具有上下级关系时,将所述至少两个地域确定为一细粒度地域;将所述至少两个地域相应的权重进行预设计算,获得所述细粒度地域相应的权重;依据所述地域集合中每一细粒度地域相应的权重,以及所述地域集合中与各地域都不具有上下级关系的粗粒度地域相应的权重,从所述地域集合包含的细粒度地域和粗粒度地域中,确定所述网络信息所属地域。6.根据权利要求5所述网络信息所属地域识别方法,其特征在于,所述从所述地域集合包含的细粒度地域和粗粒度地域中,确定所述网络信息所属地域包括:判断所述地域集合包含的细粒度地域和粗粒度地域相应的权重与第一预设阈值的大小关系;当大于等于所述第一预设阈值的权重的个数为零个时,确...
【专利技术属性】
技术研发人员:安倩,李永红,张政勇,
申请(专利权)人:北京搜狐新媒体信息技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。