兴趣点名称选择模型训练方法、使用方法、装置及存储介质制造方法及图纸

技术编号:22565205 阅读:25 留言:0更新日期:2019-11-16 12:03
本发明专利技术提供了一种兴趣点名称选择模型训练方法,包括:获取不同数据来源的兴趣点数据,形成与兴趣点数据相对应的词语级向量;根据兴趣点数据构造兴趣点名称选择模型的训练样本;通过兴趣点名称选择模型的排序网络,对待排序数据进行排序处理,获取符合命名规则的兴趣点候选名称;通过所获取的符合命名规则的兴趣点候选名称,调整兴趣点名称选择模型中特征提取网络的参数和排序网络的参数。本发明专利技术还提供了兴趣点名称选择模型使用方法、装置及存储介质。本发明专利技术能够使得训练得到的兴趣点名称选择模型能够在不同数据来源的兴趣点数据中选择符合命名规则的兴趣点候选名称,减少了由于非命名规则的兴趣点的名称引起的用户使用错误,有效提升了使用体验。

Training method, using method, device and storage medium of interest point name selection model

The invention provides a training method of interest point name selection model, which includes: obtaining interest point data from different data sources, forming word level vectors corresponding to interest point data; constructing training samples of interest point name selection model according to interest point data; sorting data through the sorting network of interest point name selection model, sorting data, and obtaining conformity The candidate names of interest points according to the naming rules are obtained, and the parameters of feature extraction network and sorting network in the interest point name selection model are adjusted. The invention also provides the use method, device and storage medium of the interest point name selection model. The invention can enable the trained interest point name selection model to select candidate names of interest points that conform to the naming rules from the interest point data of different data sources, reduce user use errors caused by the names of interest points that are not named rules, and effectively improve the use experience.

【技术实现步骤摘要】
兴趣点名称选择模型训练方法、使用方法、装置及存储介质
本专利技术涉及信息处理技术,尤其涉及兴趣点名称选择模型训练方法、使用方法、装置及存储介质。
技术介绍
在电子地图场景中,需要对兴趣点(POIPointofInterest)数据进行计算和分类,电子地图上一般采用气泡图标来表示POI,比如电子地图上的景点、政府机构、公司、商场以及饭馆等。对于POI而言,反映POI类型的一个重要特征是POI的规范名称,现有技术中,基于人工经验的POI名称优选方法能够短平快的解决需求,然而该方法时效性差、不够灵活,当某个来源的名称质量发生变化时无法及时的发现和更新,为此,机器学习(ML,MachineLearning)提供了训练适当的名称选择模型来支持上述应用的方案。其中,机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学本文档来自技高网...

【技术保护点】
1.一种兴趣点名称选择模型训练方法,其特征在于,所述方法包括:/n获取不同数据来源的兴趣点数据,并对所述兴趣点数据进行分词处理,形成与所述兴趣点数据相对应的词语级向量;/n根据所述兴趣点数据构造兴趣点名称选择模型的训练样本;/n通过所述兴趣点名称选择模型的特征提取网络,提取与所述训练样本相对应的特征向量,以形成与所述训练样本相对应的待排序数据;/n其中,所述待排序数据包括:第一候选名称和第二候选名称;/n通过所述兴趣点名称选择模型的排序网络,对所述待排序数据进行排序处理,获取符合命名规则的兴趣点候选名称;/n通过所获取的符合命名规则的兴趣点候选名称,调整所述兴趣点名称选择模型中特征提取网络的参...

【技术特征摘要】
1.一种兴趣点名称选择模型训练方法,其特征在于,所述方法包括:
获取不同数据来源的兴趣点数据,并对所述兴趣点数据进行分词处理,形成与所述兴趣点数据相对应的词语级向量;
根据所述兴趣点数据构造兴趣点名称选择模型的训练样本;
通过所述兴趣点名称选择模型的特征提取网络,提取与所述训练样本相对应的特征向量,以形成与所述训练样本相对应的待排序数据;
其中,所述待排序数据包括:第一候选名称和第二候选名称;
通过所述兴趣点名称选择模型的排序网络,对所述待排序数据进行排序处理,获取符合命名规则的兴趣点候选名称;
通过所获取的符合命名规则的兴趣点候选名称,调整所述兴趣点名称选择模型中特征提取网络的参数和排序网络的参数。


2.根据权利要求1所述的方法,其特征在于,所述对所述兴趣点数据进行分词处理,形成与所述兴趣点数据相对应的词语级向量,包括:
对所述兴趣点数据进行数据筛选处理,以实现获取符合文法要求的兴趣点数据;
触发目标分词库,并通过所述目标分词库对所述符合文法要求的兴趣点数据进行分词处理,以获得词语级兴趣点数据;
对所述词语级兴趣点数据进行向量化处理,形成兴趣点数据的多维词语级向量。


3.根据权利要求1所述的方法,其特征在于,所述根据所述兴趣点数据构造兴趣点名称选择模型的训练样本,包括:
确定每一个兴趣点数据中的核心趣点数据和普通兴趣点数据;
根据所述每一个兴趣点数据中的核心趣点数据和普通兴趣点数据,按照相应的数据集文本规则,组成相应的单一数据集样本;
确定所述单一数据集样本的标签,其中,所述标签用于表征所述述单一数据集样本中各个参数之间的比较结果。


4.根据权利要求1所述的方法,其特征在于,所述通过所述兴趣点名称选择模型的特征提取网络,提取与所述训练样本相对应的特征向量,以形成与所述训练样本相对应的待排序数据,包括:
通过所述特征提取网络的嵌入层网络利用所述兴趣点数据相对应的词语级向量,对所述训练样本进行词语向量矩阵转换;
通过所述特征提取网络的卷积层网络对所述词语向量矩阵转换的结果进行点乘求和处理;
通过所述特征提取网络的池化层网络对所述点乘求和处理的结果进行池化处理,提取与所述训练样本相对应的特征向量;
确定与所述训练样本所包括的待排序数据相对应的特征向量。


5.根据权利要求1所述的方法,其特征在于,所述通过所述兴趣点名称选择模型的排序网络,对所述待排序数据进行排序处理,获取符合命名规则的兴趣点候选名称,包括:
确定所述待排序数据中的第一候选名称与核心趣点数据的相关性的第一比较结果;
确定所述待排序数据中的第二候选名称与所述核心趣点数据的相关性的第二比较结果;
通过所述兴趣点名称选择模型的排序网络对所述第一比较结果和第二比较结果进行处理,以实现在所述第一候选名称和第二候选名称中确定符合命名规则的兴趣点候选名称。


6.根据权利要求5所述的方法,其特征在于,所述通过所述兴趣点的标准文本与所获取的符合命名规则的兴趣点候选名称,调整所述兴趣点名称选择模型中...

【专利技术属性】
技术研发人员:王宇
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1