一种基于地理信息的问题推送方法及系统技术方案

技术编号:6952525 阅读:226 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种基于地理信息的问题推送方法及系统,其问题推送方法预先根据用户属性信息中的地理词建立各用户的用户地理模型,包括:A、获取用户提交的问题,并从所述问题中提取地理词;B、利用提取的地理词与各用户地理模型进行匹配,利用匹配到的用户地理模型对应的用户形成用户列表;C、将所述问题推送给所述用户列表中的用户。本发明专利技术通过用户填写的个人信息挖掘用户的地理兴趣词模型,给具有地理位置属性的用户推送具有同样地理位置属性的问题,使问题推送更加精确,减小服务器和客户端的负担和资源浪费。

【技术实现步骤摘要】
一种基于地理信息的问题推送方法及系统
本专利技术涉及互联网应用
,尤其涉及一种基于地理信息的问题推送方法及系统。
技术介绍
随着计算机和网络技术的发展,网络互动问答平台为网民提供了一个可以进行互动交流的平台,越来越受到人们的欢迎,如百度知道、新浪爱问、谷歌问答、搜搜问问、雅虎知识堂等。人们可以提出问题,接受专家或者其他用户的帮助,也可以解决问题,为其他用户提供帮助。在网络互动问答平台的交互过程中,问题推送系统起着十分重要的作用。问题推送系统根据用户的问答记录,主动地将问题分门别类地传送到相应的用户设备中。它一方面可以为用户推送其可能感兴趣的问题,增加用户的积极性,另一方面通过及时的问题推送,有利于解决其他用户的问题,可以提高问题的解答率。这种主动推送问题的方式,改变了互联网上单一地信息访问的方式,将用户搜寻信息变为有目的地接收信息,从而改变了信息流动的方向,有助于减少用户漫无目的浏览、点击等行为,同时通过信息流量的减少减轻网站服务器的负担。现有的问题推送系统的主要技术思路是通过挖掘用户的答复或提问等历史记录得到用户的兴趣词模型,并以相关的兴趣词模型为基础进行推送。然而,虽然基于用户兴趣进行问题推送,但在很多时候,由于地理位置的原因,用户无法对感兴趣的问题进行解答。例如,某用户虽然对数码产品感兴趣,现有问题推送方式可能会向该用户推送诸如“尼康D7000在上海的售价为多少”、“三星手机在杭州的维修点在哪里”之类的问题,而该用户可能在北京,对这些问题虽然感兴趣但由于地理位置的限制无法解答。因此,单纯基于用户兴趣的问题推送方式不但没有起到应有的作用,反而降低用户了的使用感受,同时对服务器和客户端都会造成负担和资源的浪费。
技术实现思路
为了解决上述问题,本专利技术提供了一种基于地理信息的问题推送方法及系统,使得问题推送更加精确,减小服务器和客户端的负担和资源浪费。具体技术方案如下:相应地,本专利技术实施例提供的一种基于地理信息的问题推送方法,预先根据用户属性信息中的地理词建立各用户的用户地理模型;该方法包括:A、获取用户提交的问题,并从所述问题中提取地理词;B、利用提取的地理词与各用户地理模型进行匹配,利用匹配到的用户地理模型对应的用户形成用户列表;C、将所述问题推送给所述用户列表中的用户。根据本专利技术之一优选实施例,所述预先根据用户属性信息中的地理词建立各用户的用户地理模型具体包括:从各用户属性信息中得到各用户的地理字段文本;对各用户的地理字段文本进行分词;从分词结果中提取地理词并赋予原始地理权重形成各用户的用户地理模型。根据本专利技术之一优选实施例,根据地理词的倒文档率为地理词赋予原始地理权重。根据本专利技术之一优选实施例,所述步骤A具体包括:A1、获取用户提交的问题或问题的标题文本;A2、对所述问题或所述标题文本进行分词;A3、从分词结果中提取地理词,并为所述地理词赋予当前地理权重。根据本专利技术之一优选实施例,在步骤A3中,根据地理词的倒文档率与步骤A2得到的分词结果中各词语的倒文档率之和的比值,为地理词赋予当前地理权重。根据本专利技术之一优选实施例,将建立的各用户的用户地理模型存至用户地理模型库,且利用各用户地理模型的地理词建立倒排索引;步骤B中所述利用提取的地理词与各用户地理模型进行匹配具体为:利用所述提取的地理词在所述用户地理模型库中查找倒排索引,将命中的用户地理模型对应的用户确定为所述匹配到的用户地理模型对应的用户。根据本专利技术之一优选实施例,步骤B中所述利用匹配到的用户地理模型对应的用户形成用户列表具体包括:计算所述匹配到的用户地理模型对应的用户与所述问题的匹配得分,所述匹配得分为从所述问题中提取的地理词的最终权重之和,所述最终权重为地理词在命中的用户地理模型中的原始地理权重与地理词的当前地理权重的乘积;选取匹配得分满足预设条件的用户形成所述用户列表。根据本专利技术之一优选实施例,所述预设条件包括:匹配得分排在前N个,N为预设的正整数;或者,匹配得分达到预设的得分阈值。相应地,本专利技术实施例提供的一种基于地理信息的问题推送系统,包括:用户模型维护模块,用于存储预先根据用户属性信息中的地理词建立的各用户的用户地理模型;取词模块,用于获取用户提交的问题,并从所述问题中提取地理词;匹配模块,用于利用所述取词模块提取的地理词与所述用户地理模型库进行匹配,利用匹配到的用户地理模型对应的用户形成用户列表;问题推送模块,用于将所述问题推送给所述用户列表中的用户。根据本专利技术之一优选实施例,所述用户模型维护模块具体包括:信息处理模块,用于从各用户属性信息中得到各用户的地理字段文本;第一分词模块,用于对各用户的地理字段文本进行分词;第一赋值模块,用于从分词结果中提取地理词并赋予原始地理权重形成各用户的用户地理模型。根据本专利技术之一优选实施例,所述第一赋值模块,根据地理词的倒文档率为地理词赋予原始地理权重。根据本专利技术之一优选实施例,所述取词模块进一步包括:问题接口模块,用于获取用户提交的问题或问题的标题文本;第二分词模块,用于对所述问题或所述标题文本进行分词;第二赋值模块,用于从分词结果中提取地理词,并为所述地理词赋予当前地理权重。根据本专利技术之一优选实施例,所述第二赋值模块根据地理词的倒文档率与所述第二分词模块得到的分词结果中各词语的倒文档率之和的比值为地理词赋予当前地理权重。根据本专利技术之一优选实施例,所述用户模型维护模块将建立的各用户的用户地理模型存至用户地理模型库,并利用各用户地理模型的地理词建立倒排索引;所述匹配模块利用所述提取的地理词在所述用户地理模型库中查找倒排索引,将命中的用户地理模型对应的用户确定为所述匹配到的用户地理模型对应的用户。根据本专利技术之一优选实施例,所述匹配模块计算所述匹配到的用户地理模型对应的用户与所述问题的匹配得分,选取匹配得分满足预设条件的用户形成所述用户列表;所述匹配得分为从所述问题中提取的地理词的最终权重之和,所述最终权重为地理词在命中的用户地理模型中的原始地理权重与地理词的当前地理权重的乘积。根据本专利技术之一优选实施例,所述预设条件包括:匹配得分排在前N个,N为预设的正整数;或者,匹配得分达到预设的得分阈值。由以上技术方案可以看出,本专利技术提供的一种基于地理信息的问题推送方法及系统,是通过用户填写的个人信息挖掘用户的地理兴趣词模型,给具有地理位置属性的用户推送具有同样地理位置属性的问题,使问题推送更加精确,减小服务器和客户端的负担和资源浪费。【附图说明】图1是本专利技术基于地理信息的问题推送方法的流程图;图2是本专利技术建立用户地理模型的流程图;图3是本专利技术存储或更新用户地理模型库的流程图;图4是本专利技术从用户提交的问题中提取地理词的流程图;图5是本专利技术利用提取的地理词与各用户地理模型匹配的流程图;图6是本专利技术基于地理信息的问题推送系统的架构图;图7是本专利技术的用户模型维护模块10的内部架构图;图8是本专利技术的取词模块20的内部架构图。【具体实施方式】为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。如图1所示,为本专利技术一实施例中提供的一种基于地理信息的问题推送方法的流程图,所述的问题推送方法包括以下步骤:步骤T00、预先根据用户属性信息中的地理词建立各用户的用户地理本文档来自技高网
...
一种基于地理信息的问题推送方法及系统

【技术保护点】
1.一种基于地理信息的问题推送方法,其特征在于,预先根据用户属性信息中的地理词建立各用户的用户地理模型;该方法包括:A、获取用户提交的问题,并从所述问题中提取地理词;B、利用提取的地理词与各用户地理模型进行匹配,利用匹配到的用户地理模型对应的用户形成用户列表;C、将所述问题推送给所述用户列表中的用户。

【技术特征摘要】
1.一种基于地理信息的问题推送方法,其特征在于,预先根据用户属性信息中的地理词建立各用户的用户地理模型;该方法包括:A、获取用户提交的问题,并从所述问题中提取地理词;B、利用提取的地理词与各用户地理模型进行匹配,利用匹配到的用户地理模型对应的用户形成用户列表;C、将所述问题推送给所述用户列表中的用户;所述预先根据用户属性信息中的地理词建立各用户的用户地理模型具体包括:从各用户属性信息中得到各用户的地理字段文本;对各用户的地理字段文本进行分词;从分词结果中提取地理词并赋予原始地理权重形成各用户的用户地理模型。2.根据权利要求1所述的方法,其特征在于,根据地理词的倒文档率为地理词赋予原始地理权重。3.根据权利要求1所述的方法,其特征在于,所述步骤A具体包括:A1、获取用户提交的问题或问题的标题文本;A2、对所述问题或所述标题文本进行分词;A3、从分词结果中提取地理词,并为所述地理词赋予当前地理权重。4.根据权利要求3所述的方法,其特征在于,在步骤A3中,根据地理词的倒文档率与步骤A2得到的分词结果中各词语的倒文档率之和的比值,为地理词赋予当前地理权重。5.根据权利要求1所述的方法,其特征在于,将建立的各用户的用户地理模型存至用户地理模型库,且利用各用户地理模型的地理词建立倒排索引;步骤B中所述利用提取的地理词与各用户地理模型进行匹配具体为:利用所述提取的地理词在所述用户地理模型库中查找倒排索引,将命中的用户地理模型对应的用户确定为所述匹配到的用户地理模型对应的用户。6.根据权利要求1所述的方法,其特征在于,步骤B中所述利用匹配到的用户地理模型对应的用户形成用户列表具体包括:计算所述匹配到的用户地理模型对应的用户与所述问题的匹配得分,所述匹配得分为从所述问题中提取的地理词的最终权重之和,所述最终权重为地理词在命中的用户地理模型中的原始地理权重与地理词的当前地理权重的乘积;选取匹配得分满足预设条件的用户形成所述用户列表。7.根据权利要求6所述的方法,其特征在于,所述预设条件包括:匹配得分排在前N个,N为预设的正整数;或者,匹配得分达到预设的得分阈值。8.一种基于地理信息的问题推送系统,其特...

【专利技术属性】
技术研发人员:谢双宾罗建岚李连华
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1