多媒体文件标题生成方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37075419 阅读:17 留言:0更新日期:2023-03-29 19:52
本申请公开了一种多媒体文件标题生成方法、装置、电子设备和存储介质,涉及数据处理领域,具体涉及自然语言处理技术领域。具体实现方案为:获取实体对象的标题文本,并获取实体对象的相关参数信息;其中,实体对象为多媒体文件中的内容实体对象;确定标题文本的分类类别;对标题文本进行序列标注,获得标题文本对应的序列标注结果;根据分类类别,确定与分类类别对应的目标多媒体文件标题生成策略信息;根据序列标注结果和相关参数信息,采用目标多媒体文件标题生成策略信息生成对应的多媒体文件标题。本申请可提高多媒体文件标题与多媒体文件内容的相关性,优化多媒体文件标题质量。量。量。

【技术实现步骤摘要】
多媒体文件标题生成方法、装置、电子设备和存储介质


[0001]本申请涉及数据处理领域,具体涉及自然语言处理
,尤其涉及一种多媒体文件标题生成方法、装置、电子设备和存储介质。

技术介绍

[0002]随着电子商务的发展,视频作为一种优秀的媒介展示形式,被越来越多的商家选择。很多商家为了提高视频发布速度,选择直接将商品标题复用到视频标题中。这种做法虽然在视频发布速度上具有较大的优势,但是这种直接复用商品标题的视频标题对于视频的介绍和视频主题的表达存在较大差异。也就是视频标题与视频内容相关性不高,影响视频播放量、用户与商家之间的互动以及用户体验,进而导致用户流失等一系列问题。

技术实现思路

[0003]本公开提供了一种多媒体文件标题生成方法、装置、电子设备和存储介质。
[0004]根据本申请的第一方面,提供了一种多媒体文件标题生成方法,包括:
[0005]获取实体对象的标题文本,并获取所述实体对象的相关参数信息;其中,所述实体对象为所述多媒体文件中的内容实体对象;
[0006]确定所述标题文本的分类类别;
[0007]对所述标题文本进行序列标注,获得所述标题文本对应的序列标注结果;
[0008]根据所述分类类别,确定与所述分类类别对应的目标多媒体文件标题生成策略信息;
[0009]根据所述序列标注结果和所述相关参数信息,采用所述目标多媒体文件标题生成策略信息生成对应的多媒体文件标题。
[0010]根据本申请的第二方面,提供了一种多媒体文件标题生成装置,包括:
[0011]获取模块,用于获取实体对象的标题文本,并获取所述实体对象的相关参数信息;其中,所述实体对象为所述多媒体文件中的内容实体对象;
[0012]第一确定模块,用于确定所述标题文本的分类类别;
[0013]序列标注模块,用于对所述标题文本进行序列标注,获得所述标题文本对应的序列标注结果;
[0014]第二确定模块,用于根据所述分类类别,确定与所述分类类别对应的目标多媒体文件标题生成策略信息;
[0015]生成模块,用于根据所述序列标注结果和所述相关参数信息,采用所述目标多媒体文件标题生成策略信息生成对应的多媒体文件标题。
[0016]根据本申请的第三方面,提供了一种电子设备,包括:
[0017]至少一个处理器;以及
[0018]与所述至少一个处理器通信连接的存储器;其中,
[0019]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一
个处理器执行,以使所述至少一个处理器能够执行前述第一方面所述的方法。
[0020]根据本申请的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行前述第一方面所述的方法。
[0021]根据本申请的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据前述第一方面所述方法的步骤。
[0022]根据本申请实施例的多媒体文件标题生成方法,根据实体对象标题文本的分类类别,确定对应的目标多媒体文件标题生成策略信息,可以使得生成的多媒体文件标题具有一定差异性、新颖性,可在一定程度上避免了生成标题格式过于生硬死板的情况。基于实体对象的标题文本所对应的序列标注结果与实体对象本身的相关参数信息,采用目标多媒体文件标题生成策略信息生成多媒体文件标题,提高了多媒体文件标题与多媒体文件内容的相关性,优化多媒体文件标题质量。
[0023]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0024]附图用于更好地理解本方案,不构成对本申请的限定。其中:
[0025]图1是根据本申请实施例提供的一种多媒体文件标题生成方法的流程示意图;
[0026]图2是根据本申请实施例提供的另一种多媒体文件标题生成方法的流程示意图;
[0027]图3是根据本申请实施例提供的对实体对象的标题文本进行序列标注的示意图;
[0028]图4是根据本申请实施例提供的又一种多媒体文件标题生成方法的流程示意图;
[0029]图5是根据本申请实施例提供的一种多媒体文件标题生成装置的结构框图;
[0030]图6是根据本申请实施例提供的另一种多媒体文件标题生成装置的结构框图;
[0031]图7是用以实现本申请实施例的多媒体文件标题生成方法的电子设备的框图。
具体实施方式
[0032]以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0033]本申请提出一种多媒体文件标题生成方法、装置、电子设备和存储介质。具体地,下面参考附图描述本申请实施例的多媒体文件标题生成方法、装置、电子设备和存储介质。
[0034]图1是根据本申请实施例提供的一种多媒体文件标题生成方法的流程示意图。需要说明的是,本申请实施例的多媒体文件标题生成方法可应用于本申请实施例的多媒体文件标题生成装置,该多媒体文件标题生成装置可被配置于电子设备上。如图1所示,该多媒体文件标题生成方法包括如下步骤:
[0035]步骤101,获取实体对象的标题文本,并获取该实体对象的相关参数信息。其中,实体对象为多媒体文件中的内容实体对象。
[0036]需要说明的是,实体对象可以是商品,多媒体文件可以是内容为商品相关的视频文件。作为一种示例,实体对象的相关参数信息可以是品牌、地域、产品规格、尺寸等参数信
息。
[0037]步骤102,确定标题文本的分类类别。
[0038]作为一种可能的实现方式,在本申请一些实施例中,可将标题文本输入至预设的多分类模型,获得标题文本的分类类别。其中,该多分类模型已经学习得到样本文本与预定的多个分类类别之中一个分类类别的映射关系,且多分类模型用于将输入数据分类至多个分类类别中的某一分类类别。作为一种示例,可将实体对象的标题文本分为价格、介绍、说明、品牌、作用等分类类别。
[0039]需要说明的是,为了提高预设的多分类模型分类准确率,在本申请一些实施例中,可采用规则加人工的方式对实体对象的标题进行标注,获得每个分类类别下一定数量的正样本数据。同时,对于每个分类类别,随机选择其他分类类别下的样本数据,作为负样本数据,以保持正负样本的均衡。基于各个分类类别下的正负样本数据,训练基于bert系列的多分类模型,以使该模型学习得到样本文本与预定的多个分类类别之中一个分类类别的映射关系。将经过训练的基于bert系列的多分类模型作为本申请实施例中的多分类模型,用于将输入数据分类至多个分类类别本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多媒体文件标题生成方法,包括:获取实体对象的标题文本,并获取所述实体对象的相关参数信息;其中,所述实体对象为所述多媒体文件中的内容实体对象;确定所述标题文本的分类类别;对所述标题文本进行序列标注,获得所述标题文本对应的序列标注结果;根据所述分类类别,确定与所述分类类别对应的目标多媒体文件标题生成策略信息;根据所述序列标注结果和所述相关参数信息,采用所述目标多媒体文件标题生成策略信息生成对应的多媒体文件标题。2.如权利要求1所述的方法,其中,所述确定所述标题文本的分类类别,包括:将所述标题文本输入至预设的多分类模型,获得所述标题文本的分类类别;其中,所述多分类模型已经学习得到样本文本与预定的多个分类类别之中一个分类类别的映射关系,且所述多分类模型用于将输入数据分类至所述多个分类类别中的某一分类类别。3.如权利要求1所述的方法,其中,所述对所述标题文本进行序列标注,获得所述标题文本对应的序列标注结果,包括:基于预设的序列标注模型对所述标题文本进行序列标注,获得所述标题文本对应的序列标注结果;其中,所述序列标注模型已经学习得到样本文本与预定的多个标签之间的映射关系。4.如权利要求1所述的方法,其中,所述根据所述分类类别,确定与所述分类类别对应的目标多媒体文件标题生成策略信息,包括:确定多个多媒体文件标题生成策略信息;其中,每个所述多媒体文件标题生成策略信息对应一个分类类别;从所述多个多媒体文件标题生成策略信息中,确定出与所述标题文本的分类类别对应的目标多媒体文件标题生成策略信息。5.如权利要求1所述的方法,其中,所述目标多媒体文件标题生成策略信息中至少包括标题模板,所述序列标注结果中至少包括核心词标签和至少一种属性标签;所述根据所述序列标注结果和所述相关参数信息,采用所述目标多媒体文件标题生成策略信息生成对应的多媒体文件标题,包括:根据所述序列标注结果,从所述标题文本中确定出所述核心词标签对应的第一词文本和每种所述属性标签对应的第二词文本;将所述第二词文本对应的属性标签与所述相关参数信息进行聚合处理,并从所述聚合处理后得到的内容中选择一个或多个参数;将所述选择的参数对应的文本和所述核心词标签对应的第一词文本添加至所述标题模板中,以生成对应的多媒体文件标题。6.如权利要求1至5中任一项所述的方法,在所述根据所述序列标注结果和所述相关参数信息,采用所述目标多媒体文件标题生成策略信息生成对应的多媒体文件标题之前,所述方法还包括:对所述实体对象的相关参数信息进行异常数据处理。7.一种多媒体文件标题生成装置,包括:
获取模块,用于获取实体对象的标题文本,并获取所述实体对象的相关参数信息;其中,所述实体对象为所述多媒体文...

【专利技术属性】
技术研发人员:谭云飞刘晓庆
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1