一种基于语言模型的媒体内容预测方法技术

技术编号：39667756 阅读：11 留言：0更新日期：2023-12-11 18:32

本申请公开了一种基于语言模型的媒体内容预测方法

全部详细技术资料下载

【技术实现步骤摘要】
一种基于语言模型的媒体内容预测方法、设备及介质

[0001]本申请涉及数据处理
，尤其涉及一种基于语言模型的媒体内容预测方法
、
设备及介质
。

技术介绍

[0002]新媒体平台通常是大众消遣娱乐的主要网络公共场所和空间，大众关注的内容也通常是短小的
、
简洁的
、
执行简单的
、
确定性强的
。
而科普内容或者行业知识普及内容，普遍是长篇的
、
复杂的
、
不确定性强的，科普型
KOL
通常难以平衡上述两种内容属性上的内生矛盾
。
在微信公众号
、
微博
、
推特等新媒体平台上，新媒体编辑常常由于上述矛盾无法准确地预测爆款媒体内容
。

技术实现思路

[0003]为了解决上述问题，本申请提出了一种基于语言模型的媒体内容预测方法，包括：确定预设种类内容的预设种类标准，根据所述预设种类标准进行加权计算，以得到预设种类指标；获取历史媒体内容，根据所述预设种类标准确定所述历史媒体内容的预设种类数据，并确定所述历史媒体内容的内容指标，根据所述内容指标确定所述历史媒体内容的标签数据；将所述标签数据作为输入数据，并根据所述预设种类指标和所述预设种类数据确定验证数据，根据所述输入数据和所述验证数据对预先设置的语言模型进行训练，以得到媒体预测模型；确定媒体内容，将所述媒体内容输入所述预测模型，以得到预测结果，根据所述预测结果...

【技术保护点】

【技术特征摘要】
1.
一种基于语言模型的媒体内容预测方法，其特征在于，包括：确定预设种类内容的预设种类标准，根据所述预设种类标准进行加权计算，以得到预设种类指标；获取历史媒体内容，根据所述预设种类标准确定所述历史媒体内容的预设种类数据，并确定所述历史媒体内容的内容指标，根据所述内容指标确定所述历史媒体内容的标签数据；将所述标签数据作为输入数据，并根据所述预设种类指标和所述预设种类数据确定验证数据，根据所述输入数据和所述验证数据对预先设置的语言模型进行训练，以得到媒体预测模型；确定媒体内容，将所述媒体内容输入所述预测模型，以得到预测结果，根据所述预测结果判断所述媒体内容是否为预设种类内容
。2.
根据权利要求1所述的方法，其特征在于，所述方法还包括：若所述媒体内容为预设种类内容，则根据所述媒体内容确定多个媒体标题；将所述媒体标题输入预先设置的标题模型，以根据所述多个媒体标题确定预设种类标题，并根据所述预设种类标题将所述媒体内容进行发布
。3.
根据权利要求2所述的方法，其特征在于，将所述媒体标题输入预先设置的标题模型之前，所述方法还包括：确定预先设置的数据元素，根据所述数据元素确定所述历史媒体内容的训练数据，并根据所述训练数据对所述标题模型进行训练，以通过训练后的所述标题模型确定预设种类标题，其中，所述数据元素包括媒体内容
、
媒体标题
、
标题满意度，所述媒体内容和媒体标题为输入数据，所述标题满意度为验证数据
。4.
根据权利要求1所述的方法，其特征在于，所述预设种类标准包括播放量标准和点赞量标准；根据所述预设种类指标和所述预设种类数据确定验证数据，具体包括：确定预先设置的权重，根据所述权重
、
所述播放量标准和所述点赞量标准计算所述预设种类指标；确定所述历史媒体内容的预设种类数据，其中，所述预设种类数据包括播放量和点赞量，根据所述预设种类数据和所述权重计算所述历史媒体内容的预设种类指数，并将所述预设种类指数与所述预设种类指标进行比较；若所述预设种类指数小于所述预设种类指标，则判断所述历史媒体内容不是预设种类内容；若所述预设种类指数大于或等于所述预设种类指标，则判断所述历史媒体内容是预设种类内容；将所述历史媒体内容的判断结果作为所述验证数据
。5.
根据权利要求4所述的方法，其特征在于，根据所述内容指标确定所述历史媒体内容的标签数据，具体包括：确定预先设置的多个采集时间，根据所述多个采集时间对所述历史媒体内容进行采集，以得到多个内容指标；将所述多个内容指标进行组合，以得到所述标签数据
。
6.
根据权利要求5所述的方法，其特征在于，所述内容指标包括点赞量
、
转发量
、
情绪数值；所述方法还包括：获取所述历史媒体内容的评论，并确定所述评论中的词汇；确定预先设置的情绪词汇数据库，其中，所述情绪词汇数据库包括预先确定的积极情绪词汇和预先确定的消极情绪词汇；根据所述词汇和所述情绪词汇数据库计算所述评论的情绪数值，其中，所述情绪数值的计算公式为：其中，
IE
为所述情绪数值，
positive
表示积极情绪数值，
negative
表示消极情绪数值，
Rate
p
为积极情绪相似度，
Rate
n
为消极情绪相似度；所述积极情绪相似度的计算公式为：其中，
Count
为所述词汇的数量，
Count
p
为所述词汇中与所述积极...

【专利技术属性】
技术研发人员：宋业臻，肖维斌，黄杰，李小龙，陈婷，林振林，
申请(专利权)人：山东心法科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人