一种基于地域特征向用户推荐文章的方法和装置制造方法及图纸

技术编号:15792094 阅读:39 留言:0更新日期:2017-07-09 23:18
本发明专利技术提供了一种基于地域特征向用户推荐文章的方法和装置。所述方法包括:提取已有文章库里的文章的地域特征度;根据文章的地域特征度、预先已建立的地域库和地域关键词库来确定文章与地域之间的匹配度;获取与用户关联的地域信息,利用该地域与文章库里的文章之间的匹配度按预设方式选取一定数量的相应文章推荐给用户。

【技术实现步骤摘要】
一种基于地域特征向用户推荐文章的方法和装置
本专利技术涉及信息处理
,具体而言涉及一种基于地域特征向用户推荐文章的方法和装置。
技术介绍
随着通信网络的推广和智能终端的普及,人们越来越习惯使用电子产品进行阅读。例如,在电子计算机上登录新闻网站或者小说网站阅读各种新闻或小说,也可以登录网上图书馆来阅读各种图书。再例如,使用智能手机或平板电脑等智能移动终端上安装的第三方应用来实现阅读,如新闻类的“今日头条”、小说类的“书旗小说”、还有其它期刊类的APP等等。面对体现产品个性化的市场需求,很多阅读产品都需要提供良好的搜索功能和推荐功能。尤其是智能移动终端,由于屏幕尺寸大小和硬件性能的限制,阅读产品的搜索功能受到一定限制,不像电子计算机提供的搜索功能那样强大。为了弥补这样的不足,更为了让用户不用花费太多时间自己查询资源,很多第三方应用都具有推荐功能,向用户推荐热门文章,例如向用户推荐热门新闻,如上了今日头条的新闻。在实行推荐的各类应用场景中,有一种场景是基于用户所在地域进行文章推荐,例如:在某些新闻类应用中、在提供旅游信息的应用中,都会有一个地域专栏,提供各个地域的新闻、各个地域的旅游信息等。但是,现有的地域推荐都是被动式推荐,即当用户阅读地域专栏时才会向用户推荐本专栏的信息,而推荐方法也无非采用向用户推荐浏览量最高的文章或者推荐点赞率最高的文章等方式,目前的文章推荐方法不能给用户带来很好的体验,例如一个久在上海工作但家乡在广州的用户,想了解家乡广州的信息,只能登录关于广州的网站,查询广州的信息,而接收到推荐的文章也仅仅所谓的热门文章,但未必是该用户想要关心和了解的信息。
技术实现思路
本专利技术的目的在于提供一种基于地域特征向用户推荐文章的方法和装置,以改善上述问题。本专利技术实施例提供了一种基于地域特征向用户推荐文章的方法,其包括:提取已有文章库里的文章的地域特征度;根据文章的地域特征度、预先已建立的地域库和地域关键词库来确定文章与地域之间的匹配度;获取与用户关联的地域信息,利用该地域与文章库里的文章之间的匹配度按预设方式选取一定数量的相应文章推荐给用户。其中,所述预先已建立的地域库包括:国家的国名、该国家管辖的各个级别的地域名、以及各个级别的地域名之间的隶属关系、和所述地域隶属关系之间的权重。其中,建立所述地域库的方法包括:根据每个国家对本国的行政区域划分方法来收录从一个国家的国名到最小行政区域的地域名及其隶属关系,使用区域平均权重法来确定地域隶属关系之间的权重,即用每个下一级区域与直接隶属于上一级区域的所有下一级区域的数量的比值作为直接上下级区域隶属关系的权重;多级区域的两个区域之间的权重为相应多个直接上下级区域隶属关系的权重相乘之积。其中,所述预先已建立的地域关键词库包括:表示每个地域名的1个或多个关键词,和该1个或多个关键词与对应地域名的关联性,其中圈定用于表示每个地域名的1个或多个关键词的规则包括但不限于:1、每个地域的正式名称;2、能够代表一个地域的公认的别称;3、一个地域有代表性的标志性建筑或风景区。其中,在提取已有文章库里的文章的地域特征度的步骤中,提取所述文章的地域特征度的方法为:其中:Pa,t表示已有文章库里的文章a对预设地域关键词库里的关键词t的地域特征度;na,t表示已有文章库里的文章a中出现预设地域关键词库里的关键词t的次数;la表示已有文章库里的文章a经过分词处理得到的分词数量。其中,在根据文章的地域特征度、预先已建立的地域库和地域关键词库来确定文章与地域之间的匹配度的步骤中,确定所述匹配度的方法是:其中:sa,i表示已有文章库里的文章a与地域库里的地域i的匹配度;R表示预设地域库中的所有地域的集合;T表示预设地域关键词库中的所有关键词的集合;pa,t表示已有文章库里的文章a对预设地域关键词库里的关键词t的地域特征度;ft,i表示预设地域关键词库里的关键词t与预设地域库里的地域i是否关联,取值1和0,当关键词t与地域i关联时取值为1,反之取值为0;ft,j表示预设地域关键词库里的关键词t与预设地域库里的地域j是否关联,取值1和0,当关键词t与地域j关联时取值为1,反之取值为0;wj,i表示预设地域库里的地域i隶属于地域j的权重,地域i和地域j没有隶属关系时wj,i为0。其中,在获取与用户关联的地域信息的步骤中,包括:通过用户联网的IP地址获取与用户关联的地域信息,或者通过智能移动终端的定位功能来获取与用户关联的地域信息,或者通过用户注册时提供的常住地址来获取与用户关联的地域信息。其中,在利用该地域与文章库里的文章之间的匹配度按预设方式选取一定数量的相应文章推荐给用户的步骤中,从大于或等于预设阈值的匹配度所对应的多篇文章中随机选取一定数量的相应文章推荐给用户;或者按照匹配度从大到小顺序选取一定数量的相应文章推荐给用户。优选的,对选取的一定数量的相应文章首先按一定条件进行排序,然后优先向用户推荐排序在前面的多篇文章。本专利技术实施例还提供了一种基于地域特征向用户推荐文章的装置,其包括:文章地域特征度提取单元,用于提取已有文章库里的文章的地域特征度;匹配度确定单元,用于根据文章的地域特征度、预先已建立的地域库和地域关键词库来确定文章与地域之间的匹配度;推荐单元,用于获取与用户关联的地域信息,利用该地域与文章库里的文章之间的匹配度按预设方式选取一定数量的相应文章推荐给用户。其中,所述装置还包括:地域库建立单元,用于预先建立一个地域库,该地域库包括:国家的国名、该国家管辖的各个级别的地域名、以及各个级别的地域名之间的隶属关系、和所述地域隶属关系之间的权重;和地域关键词库建立单元,用于预先建立一个地域关键词库,该地域关键词库包括:表示每个地域名的1个或多个关键词,和该1个或多个关键词与对应地域名的关联性。其中,所述文章地域特征度提取单元用于提取所述文章的地域特征度的方法为:其中:pa,t表示已有文章库里的文章a对预设地域关键词库里的关键词t的地域特征度;na,t表示已有文章库里的文章a中出现预设地域关键词库里的关键词t的次数;la表示已有文章库里的文章a经过分词处理得到的分词数量。其中,所述匹配度确定单元用于确定所述匹配度的方法是:其中:sa,i表示已有文章库里的文章a与地域库里的地域i的匹配度;R表示预设地域库中的所有地域的集合;T表示预设地域关键词库中的所有关键词的集合;pa,t表示已有文章库里的文章a对预设地域关键词库里的关键词t的地域特征度;ft,i表示预设地域关键词库里的关键词t与预设地域库里的地域i是否关联,取值1和0,当关键词t与地域i关联时取值为1,反之取值为0;ft,j表示预设地域关键词库里的关键词t与预设地域库里的地域j是否关联,取值1和0,当关键词t与地域j关联时取值为1,反之取值为0;wj,i表示预设地域库里的地域i隶属于地域j的权重,地域i和地域j没有隶属关系时wj,i为0。其中,所述推荐单元用于通过用户联网的IP地址获取与用户关联的地域信息,或者通过智能移动终端的定位功能来获取与用户关联的地域信息,或者通过用户注册时提供的常住地址来获取与用户关联的地域信息。优选的,所述推荐单元用于从大于或等于预设阈值的匹配度所对应的多篇文章中随机选取一定数量的相应文章推荐给用户本文档来自技高网
...
一种基于地域特征向用户推荐文章的方法和装置

【技术保护点】
一种基于地域特征向用户推荐文章的方法,其包括:提取已有文章库里的文章的地域特征度;根据文章的地域特征度、预先已建立的地域库和地域关键词库来确定文章与地域之间的匹配度;获取与用户关联的地域信息,利用该地域与文章库里的文章之间的匹配度按预设方式选取一定数量的相应文章推荐给用户。

【技术特征摘要】
1.一种基于地域特征向用户推荐文章的方法,其包括:提取已有文章库里的文章的地域特征度;根据文章的地域特征度、预先已建立的地域库和地域关键词库来确定文章与地域之间的匹配度;获取与用户关联的地域信息,利用该地域与文章库里的文章之间的匹配度按预设方式选取一定数量的相应文章推荐给用户。2.根据权利要求1所述的方法,其特征在于所述预先已建立的地域库包括:国家的国名、该国家管辖的各个级别的地域名、以及各个级别的地域名之间的隶属关系、和所述地域隶属关系之间的权重。3.根据权利要求2所述的方法,其特征在于建立所述地域库的方法包括:根据每个国家对本国的行政区域划分方法来收录从一个国家的国名到最小行政区域的地域名及其隶属关系,使用区域平均权重法来确定地域隶属关系之间的权重,即用每个下一级区域与直接隶属于上一级区域的所有下一级区域的数量的比值作为直接上下级区域隶属关系的权重;多级区域的两个区域之间的权重为相应多个直接上下级区域隶属关系的权重相乘之积。4.根据权利要求1所述的方法,其特征在于所述预先已建立的地域关键词库包括:表示每个地域名的1个或多个关键词,和该1个或多个关键词与对应地域名的关联性,其中圈定用于表示每个地域名的1个或多个关键词的规则包括但不限于:1、每个地域的正式名称;2、能够代表一个地域的公认的别称;3、一个地域有代表性的标志性建筑或风景区。5.根据权利要求1所述的方法,其特征在于在提取已有文章库里的文章的地域特征度的步骤中,提取所述文章的地域特征度的方法为:其中:pa,t表示已有文章库里的文章a对预设地域关键词库里的关键词t的地域特征度;na,t表示已有文章库里的文章a中出现预设地域关键词库里的关键词t的次数;la表示已有文章库里的文章a经过分词处理得到的分词数量。6.根据权利要求1所述的方法,其特征在于在根据文章的地域特征度、预先已建立的地域库和地域关键词库来确定文章与地域之间的匹配度的步骤中,确定所述匹配度的方法是:其中:sa,i表示已有文章库里的文章a与地域库里的地域i的匹配度;R表示预设地域库中的所有地域的集合;T表示预设地域关键词库中的所有关键词的集合;pa,t表示已有文章库里的文章a对预设地域关键词库里的关键词t的地域特征度;ft,i表示预设地域关键词库里的关键词t与预设地域库里的地域i是否关联,取值1和0,当关键词t与地域i关联时取值为1,反之取值为0;ft,j表示预设地域关键词库里的关键词t与预设地域库里的地域j是否关联,取值1和0,当关键词t与地域j关联时取值为1,反之取值为0;wj,i表示预设地域库里的地域i隶属于地域j的权重,地域i和地域j没有隶属关系时wj,i为0。7.根据权利要求1所述的方法,其特征在于在获取与用户关联的地域信息的步骤中,包括:通过用户联网的IP地址获取与用户关联的地域信息,或者通过智能移动终端的定位功能来获取与用户关联的地域信息,或者通过用户注册时提供的常住地址来获取与用户关联的地域信息。8.根据权利要求1所述的方法,其特征在于在利用该地域与文章库里的文章之间的匹配度按预设方式选取一定数量的相应文章推荐给...

【专利技术属性】
技术研发人员:潘岸腾
申请(专利权)人:广州优视网络科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1