【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种内容管理的方法和装置。
技术介绍
1、内容平台具有多个领域的内容,例如,健康科普、旅行游记等等。内容平台的内容来源有很多,包括:内容平台的用户原创生成、从平台外部采购引入等等,因此,内容平台通常具有重复的内容或者相似度较高的内容,重复或者相似度高的内容增加了内容管理的难度,需要对内容平台所具有的内容进行去重。在进行内容去重时,通常采用人工的方式对内容打标签、分类、补索引、判断是否相似等等,或者调用外部接口查找重复或者相似度高的内容。
2、在实现本专利技术的过程中,专利技术人发现现有技术至少存在如下问题:
3、采用人工的方式去重,消耗大量人力成本,内容管理效率低,外部接口不稳定,也会降低内容管理的效率。
技术实现思路
1、有鉴于此,本专利技术实施例提供一种内容管理的方法和装置,能够提高内容管理效率,降低人力成本。
2、为实现上述目的,根据本专利技术实施例的第一方面,提供一种内容管理的方法,包括:
3、响应于接
...【技术保护点】
1.一种内容管理的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在使用预先设置的中文嵌入模型对每个目标内容执行对应的嵌入方法之前,所述方法还包括:分别确定适用于每个目标内容的内容分段策略;根据所述内容分段策略对对应的目标内容进行分段;
3.根据权利要求2所述的方法,其特征在于,根据所述内容分段策略对对应的目标内容进行分段,包括:
4.根据权利要求2所述的方法,其特征在于,每个目标内容的嵌入向量包括:每个目标内容的多个分段结果的嵌入向量;在根据所述嵌入向量确定所述多个目标内容之间的相似度之前,所述方法还包括:
...【技术特征摘要】
1.一种内容管理的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在使用预先设置的中文嵌入模型对每个目标内容执行对应的嵌入方法之前,所述方法还包括:分别确定适用于每个目标内容的内容分段策略;根据所述内容分段策略对对应的目标内容进行分段;
3.根据权利要求2所述的方法,其特征在于,根据所述内容分段策略对对应的目标内容进行分段,包括:
4.根据权利要求2所述的方法,其特征在于,每个目标内容的嵌入向量包括:每个目标内容的多个分段结果的嵌入向量;在根据所述嵌入向量确定所述多个目标内容之间的相似度之前,所述方法还包...
【专利技术属性】
技术研发人员:刘继帅,
申请(专利权)人:北京京东拓先科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。