一种基于POI相似度与翻译机器匹配推荐算法的研究方法技术

技术编号:20075351 阅读:36 留言:0更新日期:2019-01-15 00:43
本发明专利技术涉及一种基于POI相似度与翻译机器匹配推荐算法的研究方法,属于人工智能技术领域。本发明专利技术通过先将日常旅游、购物、出行、生活中可能会用到翻译场景的兴趣点POI按属性进行划分;将翻译语句训练样本,根据属性与应用场景,建立可运于不同翻译场景下的特色翻译语句库;然后提取用户U所在位置的POI,以用户U所在位置为中心,建立搜索区域i,提取搜索区域内相应的POI信息;再对用户POI与搜索区域内POI进行匹配相似度比对,确定用户最终位置;最后,根据用户最终位置的属性c,通过基于流行度稳定性推荐算法与基于翻译语句自信息量大小推荐算法两者相结合,为用户推荐最准确、最优的翻译结果。

A Research Method Based on POI Similarity and Translation Machine Matching Recommendation Algorithms

The invention relates to a research method based on POI similarity and translation machine matching recommendation algorithm, belonging to the field of artificial intelligence technology. The method divides POI of interest points which may be used in translation scenes in daily travel, shopping, travel and daily life into attributes, builds a characteristic translation sentence library which can be transported in different translation scenarios according to attributes and application scenarios, and then extracts POI of user U location, centering on user U location, and establishes a search area I. The corresponding POI information in the search area is extracted, and then the matching similarity between user POI and POI in the search area is compared to determine the user's final location. Finally, according to the attribute C of user's final location, the most accurate and optimal translation results are recommended for users by combining the recommendation algorithm based on popularity stability and the recommendation algorithm based on the confidence information size of translated sentences.

【技术实现步骤摘要】
一种基于POI相似度与翻译机器匹配推荐算法的研究方法
本专利技术涉及一种基于POI相似度与翻译机器匹配推荐算法的研究方法,属于人工智能

技术介绍
随着当今社会快速发展,与国外的交流活动越来越多。但是对于大部分人来语言不通成为了不小的交流障碍,目前市场上出现的了各种各样的语言翻译机,输入方式比较简单,基本需要通过用户选择语言,给使用造成了不便。
技术实现思路
本专利技术要解决的技术问题是提供一种基于POI与翻译机器匹配算法的研究方法,不但解决了用户不需要对翻译语言、所需翻译场景进行选择,还解决了用户外语路牌看不懂、外语交流听不懂、国外旅行不会说、沟通难的问题,通过对用户兴趣点(POI)提取,实现根据用户所在位置为用户推荐最有效、最精准的多语言翻译环境提高了用户翻译体验度与翻译效率。本专利技术的技术方案是:一种基于POI相似度与翻译机器匹配推荐算法的研究方法,其特征在于:Step1:将日常旅游、购物、出行、生活中会用到翻译场景的兴趣点POI按属性C划分;Step2:建立运用于不同翻译场景下的特色翻译语句库;将含有X个翻译语句的训练样本,根据属性C与应用场景,使用聚类算法根据翻译语句样本使用场景与其相互之间的相似度,将其进行归类处理;划分为不同翻译场景语句集合{X1,X2,X3,…Xn},形成可用于不同翻译场景下的特色翻译语句库;Step3:用户兴趣点POI提取;一个用户U在位置L上访问了一个兴趣点POI,其中兴趣点POI由其名字id与其属性c表示,位置L通过经纬度坐标(α,β)表示;Step4:以用户U所在位置为中心,建立搜索区域i,搜索所有的在i距离阀值范围内的所有兴趣点(POI),并提取相应信息:{N(国家),B(城市),ID(名称),C(属性),X、Y(经纬度坐标)}Step5:通过计算用户POI与搜索区域中的POI几何属性之间的欧式距离来判断是否为相同实体,见式(1);设定一个阀值do,如果两个兴趣点(POI)之间的欧式距离小于当前阀值do,则认为表示同值一个为实体,见式(2);Step6:根据用户最终位置的属性c,通过基于流行度稳定性推荐算法与基于翻译语句自信息量大小推荐算法两者相结合,为用户推荐相应的翻译结果。所述基于流行度稳定性的推荐算法具体为:对于注册时间小于三个月的用户,翻译系统没有办法对用户要求作出合理的预测,此时翻译系统根据用户位置属性c,确定推荐范围;同时考虑到推荐的实效性,流行度会随着时间的推移而发生变化,故通过计算出将要被推荐的项目j的流行度稳定性s(j)对用户进行相关翻译推荐;令时间T={t1,t2,t3,t4,...,tn},pop(j,t)表示将要被推荐的项目j在任一时刻t时间段内的流行度,pop(j)表示将要被推荐的项目j在时间段T内的平均流行度,max(pop(j))和min(pop(j))表示将要被推荐的项目j在时间T内流行度最大值与最小值;所述基于翻译语句自信息量大小进行推荐算法具体为:设翻译语句库中,任一一个属性c中的翻译语句集合为Xn={xn1,xn2,…,xnn}其中n={1,2,3,…,n},每一个翻译语句被使用的概率为:P={p(xn1),p(xn2),…,p(xnn)},概率空间记为:每一条翻译语句的自信息量为:通过计算每一属性c中每一条翻译语句的自信息量,当概率p(xnn)越大,则信息量越小,翻译语句越稳定,被使用频率越高;将翻译语句自信息量从小到大排列后,推荐给用户。所述兴趣点POI分类可以按照实际需求划分。所述POI由于采集位置的差异以及数据精度,相同POI的位置也不同,采用矢量法,判断用户POI与搜索区域中的POI是否为同一实体。所述在推荐系统中,将用户反馈的总次数定义为项目的流行度,当项目反馈次数越多则流行度越高,反之越少;为了避免大众的从众心里与好奇心,随着时间推移,新事物的流行度慢慢下降趋向于一个稳定的状态;通过流行度的稳定性来衡量用户的偏好。本专利技术的有益效果是:本专利技术与现有技术相比,不但解决了用户不需要对翻译语言、所需翻译场景进行选择,而且还解决了用户外语路牌看不懂、外语交流听不懂、国外旅行不会说、沟通难的问题,实现根据用户所在位置为用户推荐最有效、最精准的多语言翻译环境提高了用户翻译体验度与翻译效率。附图说明图1是本专利技术步骤流程图。具体实施方式下面结合附图和具体实施方式,对本专利技术作进一步说明。实施例1:如图1所示,一种基于POI与翻译机器匹配算法的研究方法,通过先将日常旅游、购物、出行、生活中可能会用到翻译场景的兴趣点POI按属性进行划分;将翻译语句训练样本,根据属性与应用场景(使用聚类算法),建立可运于不同翻译场景下的特色翻译语句库;然后提取用户U所在位置的POI,以用户U所在位置为中心,建立搜索区域i,提取搜索区域内相应的POI信息;再对用户POI与搜索区域内POI进行匹配相似度比对(使用欧式距离进行空间属性特征匹配),确定用户最终位置;最后,根据用户最终位置的属性c,通过基于流行度稳定性推荐算法与基于翻译语句自信息量大小推荐算法两者相结合,为用户推荐最准确、最优的翻译结果。述方法的具体步骤如下:Step1:将日常旅游、购物、出行、生活中可能会用到翻译场景的兴趣点POI按属性C划分为:一级目录:餐饮、购物、住宿、出行、文体娱乐、金融服务、生活服务、汽车服务、教育、医疗、房产、旅游、企事业单位、行政机构、公共服务二级目录:餐饮(快餐、西餐、餐厅、咖啡茶馆、其他)购物(商场、超市、电子电器、建材家居、农贸市场、专营店、其他)住宿(宾馆旅店、公寓)出行(长途汽车站、火车站、机场、码头、地铁、公交、加油站、停车场、高速、服务区)文体娱乐(博物馆、展览馆、会展中心、图书馆、书店、美术馆、音乐厅、影剧戏院、青少年宫、科技文化馆、纪念馆、动物园、植物园、水族馆、公园、健身场所、体育馆、KTV、酒吧、网吧、游乐场、洗浴中心、其他)金融服务(银行、证券、保险、ATM、其他)生活服务(物流快递、法律事务所、电台报社、人才市场、彩票销售点、典当行、缴费点、通讯、家政、洗衣店、美容美发、摄影冲印、花卉服务、宠物、邮政、其他)汽车服务(汽车租赁、汽车用品、保养维修店、美容装饰店、销售店、驾校)教育(学校、培训机构)医疗(医院、急救中心、药店、诊所、其他)房产(大厦、写字楼、住宅小区、楼盘、房产中介)旅游(景点景区、宗教场所、旅行社)企事业单位(企业、事业、社会团体、科研院所、其他)行政机构(政府、出入境、公安、工商税务、交通消防、其他)公共服务(公厕、紧急避难场所、敬老院、救助站、殡葬设施、其他)Step2:建立运用于不同翻译场景下的特色翻译语句库;将含有X个翻译语句的训练样本,根据属性C与应用场景,使用聚类算法根据翻译语句样本使用场景与其相互之间的相似度,将其进行归类处理;划分为不同翻译场景语句集合{X1,X2,X3,…Xn},形成可用于不同翻译场景下的特色翻译语句库;Step3:用户兴趣点POI提取;一个用户U在位置L上访问了一个兴趣点POI,其中兴趣点POI由其名字id与其属性c表示,位置L通过经纬度坐标(α,β)表示;Step4:以用户U所在位置为中心,建立搜索区域i,搜索所有的在i距离阀值范围内的所有兴趣点(POI),并提取相应信息:{N本文档来自技高网...

【技术保护点】
1.一种基于POI相似度与翻译机器匹配推荐算法的研究方法,其特征在于:Step1:将日常旅游、购物、出行、生活中会用到翻译场景的兴趣点POI按属性C划分;Step2:建立运用于不同翻译场景下的特色翻译语句库;将含有X个翻译语句的训练样本,根据属性C与应用场景,使用聚类算法根据翻译语句样本使用场景与其相互之间的相似度,将其进行归类处理;划分为不同翻译场景语句集合{X1,X2,X3,…Xn},形成可用于不同翻译场景下的特色翻译语句库;Step3:用户兴趣点POI提取;一个用户U在位置L上访问了一个兴趣点POI,其中兴趣点POI由其名字id与其属性c表示,位置L通过经纬度坐标(α,β)表示;Step4:以用户U所在位置为中心,建立搜索区域i,搜索所有的在i距离阀值范围内的所有兴趣点(POI),并提取相应信息:{N(国家),B(城市),ID(名称),C(属性),X、Y(经纬度坐标)}Step5:通过计算用户POI与搜索区域中的POI几何属性之间的欧式距离来判断是否为相同实体,见式(1);

【技术特征摘要】
1.一种基于POI相似度与翻译机器匹配推荐算法的研究方法,其特征在于:Step1:将日常旅游、购物、出行、生活中会用到翻译场景的兴趣点POI按属性C划分;Step2:建立运用于不同翻译场景下的特色翻译语句库;将含有X个翻译语句的训练样本,根据属性C与应用场景,使用聚类算法根据翻译语句样本使用场景与其相互之间的相似度,将其进行归类处理;划分为不同翻译场景语句集合{X1,X2,X3,…Xn},形成可用于不同翻译场景下的特色翻译语句库;Step3:用户兴趣点POI提取;一个用户U在位置L上访问了一个兴趣点POI,其中兴趣点POI由其名字id与其属性c表示,位置L通过经纬度坐标(α,β)表示;Step4:以用户U所在位置为中心,建立搜索区域i,搜索所有的在i距离阀值范围内的所有兴趣点(POI),并提取相应信息:{N(国家),B(城市),ID(名称),C(属性),X、Y(经纬度坐标)}Step5:通过计算用户POI与搜索区域中的POI几何属性之间的欧式距离来判断是否为相同实体,见式(1);设定一个阀值do,如果两个兴趣点(POI)之间的欧式距离小于当前阀值do,则认为表示同值一个为实体,见式(2);Step6:根据用户最终位置的属性c,通过基于流行度稳定性推荐算法与基于翻译语句自信息量大小推荐算法两者相结合,为用户推荐相应的翻...

【专利技术属性】
技术研发人员:龙华王瑞邵玉斌杜庆治
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1