【技术实现步骤摘要】
多语言内容打标方法及模型训练方法、装置、设备及介质
[0001]本专利技术涉及信息处理领域,尤其涉及一种多语言内容打标方法和多语言内容打标模型的训练方法。
技术介绍
[0002]在线服务平台场景下,经常要给用户推荐其感兴趣的内容。旅游成为如今人们工作缓解压力的首选,在出行之前,用户经常会在在线旅游平台中搜索感兴趣的出游地并做攻略规划,但是可供选择的旅游地点很多,用户往往需要花费大量时间和精力无目的浏览和选择意向旅游地,不仅浪费时间,体验感也很差,此时就要求在线旅游平台需要根据用户的喜好推荐地点和攻略内容,尤其是针对不同用户如何准确推荐多语言内容推送,目前内容的推荐技术仅限于中文场景,无法直接复用于多语言场景,因此如何在最短时间内,对不同语言内容打标准确推送给用户,帮助不同用户找到最符合其偏好的出游地是急需解决的问题。
技术实现思路
[0003]本专利技术要解决的技术问题是为了克服现有技术中无法针对不同国家的用户推荐其感兴趣的内容缺陷,提供一种多语言内容打标方法和多语言内容打标模型的训练方法及装置、电子设备、存 ...
【技术保护点】
【技术特征摘要】
1.一种多语言内容打标方法,其特征在于,包括:获取多语言关键词,所述多语言关键词根据标签拆分组词提取得到;从多语言内容数据库中召回待打标数据,所述待打标数据是与所述多语言关键词匹配的多语言内容数据;将所述待打标数据输入至多语言内容打标模型,以由所述多语言内容打标模型的拼接层将所述标签与所述待打标数据进行拼接,由所述多语言内容打标模型的特征提取层对所述拼接层的输出结果进行特征提取,由所述多语言内容打标模型的判断层对所述特征提取层的输出结果进行归一化指数函数计算,得到的数值作为所述判断层的输出结果;其中,所述多语言内容打标模型由多个待打标数据样本训练得到;根据所述数值,判断所述标签与所述待打标内容数据是否匹配。2.如权利要求1所述的多语言内容打标方法,其特征在于,所述从多语言内容数据库中召回待打标数据的步骤之后包括:判断召回数量是否在预设阈值内,若所述召回数量在预设阈值内,则进行所述将所述待打标数据输入至多语言内容打标模型的步骤;所述召回数量表示所述待打标数据的数量。3.如权利要求2所述的多语言内容打标方法,其特征在于,若所述召回数量不在预设阈值内,则调整所述多语言关键词,并再次从多语言内容数据库中召回待打标数据。4.如权利要求1所述的多语言内容打标方法,其特征在于,所述根据所述数值,判断所述标签与所述待打标数据是否匹配的步骤包括:判断所述数值是否高于可信阈值,若所述数值高于所述可信阈值,则输出判断结果匹配,若所述数值低于所述可信阈值,则输出判断结果不匹配。5.如权利要求4所述的多语言内容打标方法,其特征在于,所述从多语言内容数据库中召回待打标数据的步骤之前还包括:获取外部调整指令,以根据所述外部调整指令调整所述可信阈值。6.一种多语言内容打标模型的训练方法,其特征在于,所述多语言内容打标模型包括拼接层、特征提取层和判断层,所述训练方法包括:获取多个待打标数据样本,每个待打标数据样本标注有标注信息,所述标注信息表征所述待打标数据样本的标签;将所述待打标数据样本输入拼接层,以由所述拼接层将所述标签与所述待打标数据样本进行拼接,由所述特征提...
【专利技术属性】
技术研发人员:甘恬,郭子嘉,孙玉霞,高一宸,
申请(专利权)人:携程旅游信息技术上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。