一种内容处理方法技术

技术编号:39713280 阅读:6 留言:0更新日期:2023-12-17 23:22
本说明书实施例公开了一种内容处理方法

【技术实现步骤摘要】
一种内容处理方法、装置以及设备


[0001]本说明书涉及内容运营
,尤其涉及一种内容处理方法

装置以及设备


技术介绍

[0002]随着互联网技术的迅速发展,提供线上内容服务的平台也越来越多,常见的内容服务比如有听书

网文

听歌

在线视频

直播等服务

以听书服务为例,则内容即为相应的读书音频,再以网文服务为例,则内容即为相应的网文文本,等等

[0003]这些内容服务的服务商通常主要通过自有应用提供服务,不过,为了进一步提高用户量和用户活跃度,也希望借助于大平台
(
比如,大体量的支付应用

即时通讯应用

电商应用等
)
,来提供自己的服务

在这种情况下,内容服务商会与大平台进行合作,将自己平台上的一些内容,主动提供给大平台,则大平台可以针对这些内容,帮助服务商进行引流,用户则可能在大平台上直接免费或付费使用这些内容,或者通过大平台进一步跳转至服务商的自有应用使用这些内容或更多内容

[0004]基于此,在大平台上,往往聚合了大量不同内容平台提供的内容,还有自己所生产的内容,为了更好地管理这些内容,便于对外提供内容服务,运营人员会对这些大规模的内容手工定义和录入标签,以及与内容与标签关联,即手工生成标签及打标,耗费了大量的运营人力,而且不同运营人员对内容的理解不同,则所打出的标签的可靠性和标准性也较差,进而会影响对外的内容服务质量,影响用户体验

[0005]因此,针对上面的这些场景,需要有助于提高平台运营效率和内容服务质量的方案


技术实现思路

[0006]本说明书一个或多个实施例提供一种内容处理方法

装置

设备以及存储介质,用以解决如下技术问题:需要有助于提高平台运营效率和内容服务质量的方案

[0007]为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
[0008]本说明书一个或多个实施例提供的一种内容处理方法,包括:
[0009]通过内容挖掘处理,自动生成标签;
[0010]将所生成的各所述标签进行分类,得到多个标签类别;
[0011]获取待打标内容,并确定内容相似度可信阈值,以及在所述多个标签类别中确定待用于打标的标签类别;
[0012]利用打标模型,对所述待打标内容与所述待用于打标的标签类别下的指定标签进行相似度分析,得到相应的相似度可信分数,若所述相似度可信分数达到所述内容相似度可信阈值,则为所述待打标内容自动打上所述指定标签

[0013]本说明书一个或多个实施例提供的一种内容处理装置,包括:
[0014]内容标签生成模块,通过内容挖掘处理,自动生成标签;
[0015]内容标签分类模块,将所生成的各所述标签进行分类,得到多个标签类别;
[0016]打标参数确定模块,获取待打标内容,并确定内容相似度可信阈值,以及在所述多个标签类别中确定待用于打标的标签类别;
[0017]内容自动打标模块,利用打标模型,对所述待打标内容与所述待用于打标的标签类别下的指定标签进行相似度分析,得到相应的相似度可信分数,若所述相似度可信分数达到所述内容相似度可信阈值,则为所述待打标内容自动打上所述指定标签

[0018]本说明书一个或多个实施例提供的一种内容处理设备,包括:
[0019]至少一个处理器;以及,
[0020]与所述至少一个处理器通信连接的存储器;其中,
[0021]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
[0022]通过内容挖掘处理,自动生成标签;
[0023]将所生成的各所述标签进行分类,得到多个标签类别;
[0024]获取待打标内容,并确定内容相似度可信阈值,以及在所述多个标签类别中确定待用于打标的标签类别;
[0025]利用打标模型,对所述待打标内容与所述待用于打标的标签类别下的指定标签进行相似度分析,得到相应的相似度可信分数,若所述相似度可信分数达到所述内容相似度可信阈值,则为所述待打标内容自动打上所述指定标签

[0026]本说明书一个或多个实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
[0027]通过内容挖掘处理,自动生成标签;
[0028]将所生成的各所述标签进行分类,得到多个标签类别;
[0029]获取待打标内容,并确定内容相似度可信阈值,以及在所述多个标签类别中确定待用于打标的标签类别;
[0030]利用打标模型,对所述待打标内容与所述待用于打标的标签类别下的指定标签进行相似度分析,得到相应的相似度可信分数,若所述相似度可信分数达到所述内容相似度可信阈值,则为所述待打标内容自动打上所述指定标签

[0031]本说明书一个或多个实施例采用的上述至少一个技术方案能够达到以下有益效果:标签的生成不仅可以通过人力编辑的方式,还通过诸如图文多模态分析自动生成

爬虫获取第三方标签等方式高效且较为可靠地自动生成标签,也提高了标签的标准性,克服了人工经验认知会对标签产生带来的局限性和差异性,能产生更多内容理解的标签;并且,基于打标模型进行内容与标签之间的相似度分析,进而基于相似度可信分数自动为内容打标,准确性好且效率高;从而,有助于提高平台运营效率和内容服务质量

附图说明
[0032]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图

[0033]图1为本说明书一个或多个实施例提供的一种针对内容的平台合作模式示意图;
[0034]图2为本说明书一个或多个实施例提供的一种内容处理方法的流程示意图;
[0035]图3为本说明书一个或多个实施例提供的图2的方法的一种具体实施方案的流程示意图;
[0036]图4为本说明书一个或多个实施例提供的一种内容处理系统的架构示意图;
[0037]图5为本说明书一个或多个实施例提供的一种自适应细粒度打标的方案的流程示意图;
[0038]图6为本说明书一个或多个实施例提供的一种用户与内容标签的交互方案的流程示意图;
[0039]图7为本说明书一个或多个实施例提供的一种内容处理装置的结构示意图;
[0040]图8为本说明书一个或多个实施例提供的一种内容处理设备的结构示意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种内容处理方法,包括:通过内容挖掘处理,自动生成标签;将所生成的各所述标签进行分类,得到多个标签类别;获取待打标内容,并确定内容相似度可信阈值,以及在所述多个标签类别中确定待用于打标的标签类别;利用打标模型,对所述待打标内容与所述待用于打标的标签类别下的指定标签进行相似度分析,得到相应的相似度可信分数,若所述相似度可信分数达到所述内容相似度可信阈值,则为所述待打标内容自动打上所述指定标签
。2.
如权利要求1所述的方法,所述通过内容挖掘处理,自动生成标签,具体包括:在本平台的内容库中获取待挖掘内容,通过多模态分析,在所述待挖掘内容中提取标签
。3.
如权利要求2所述的方法,所述通过内容挖掘处理,自动生成标签,具体包括:通过网络爬虫,在外部平台上获取所述待挖掘内容的同类内容的已有标签
。4.
如权利要求1所述的方法,所述将所生成的各所述标签进行分类,得到多个标签类别,具体包括:利用聚类算法对所生成的各所述标签进行处理,得到以下至少三种标签类别:适用时间标签类别

适用场景标签类别

适用人群标签类别
。5.
如权利要求1所述的方法,所述获取待打标内容,具体包括:获取用户提交的业务需求;在本平台的内容库中召回匹配于所述业务需求的内容,作为待打标内容
。6.
如权利要求1所述的方法,所述待打标内容是一个未切割的整体内容;所述利用打标模型,对所述待打标内容与所述待用于打标的标签类别下的指定标签进行相似度分析,具体包括:利用打标模型,将所述待打标内容切割为多块待打标子内容,将所述多块待打标子内容与所述待用于打标的标签类别下的多个指定标签进行相似度分析;所述为所述待打标内容自动打上所述指定标签,具体包括:为各所述待打标子内容,分别自动打上对应的指定标签
。7.
如权利要求1所述的方法,所述为所述待打标内容自动打上所述指定标签之后,所述方法还包括:将所述待打标内容及其被打上的各标签,通过内容服务提供给用户使用;当所述用户触发所述标签时,在所述待打标内容中自动跳转至对应于所述标签的所述待打标子内容,以便为用户播放所述待打标子内容
。8.
如权利要求7所述的方法,所述为各所述待打标子内容,分别自动打上对应的指定标签之前,所述方法还包括:计算所述待打标内容的松散度,其中,所述松散度与所述待打标内容中的内容关联性负相关,和
/
或所述松散度与所述待打标内容的信息量正相关;确定所计算出的所述松散度高于设定阈值
。9.
如权利要求7或8所述的方法,所述为所述待打标内容自动打上所述指定标签之后,所述方法还包括:
按照各所述待打标子内容在所述待打标内容中的顺序,将对应的已打上的各所述标签组织为初始的标签链向用户展示,以便于用户触发其中的标签;每当用户触发所述标签时,其他标签与当前所触发的标签之间的内容相关性高低顺序,重新组织当前的标签链中的标签顺序,得到动态标签链
。10.
如权利要求1~8任一项所述的方法,所述内容为音频内容
。11.
一种内容处理装置,包括:内容标签生成模块,通过内容挖掘处理,自动生成标签;内容标签分类模块,将所生成的各所述标签进行分类,得到多个标签类别;打标参数确定模块,获取待打标内容,并确定内容相似度可信阈值,以及在所述多个标签类别中确定待用于打标的标签类别;内容自动打标模块,利用打标模型,对所述待打标内容与所述待用于打标的标签类别下的指定标签进行相似度分析,得到相应的相似度可信分数,若所述相似度可信分数达到所述内容相似度可信阈值,则为...

【专利技术属性】
技术研发人员:敬我
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1