一种用于广告投放的投放舆情监测方法技术

技术编号:27256855 阅读:24 留言:0更新日期:2021-02-04 12:36
本发明专利技术公开了一种用于广告投放的投放舆情监测方法,该方法是通过bert、albert、roberta三种深度学习模型,根据广告投放后用户评论数据,采用多个模型融合,训练或预训练模型,提取文本特征,增强数据,并生成相似语料,作为语料扩充,再应用于下游的舆情分类任务中解决标注数据少的问题。本发明专利技术提供了一种关于广告投放的舆情监控算法,涉及自然语言理解与处理,使用深度学习的方法,深化语义理解,识别情感,可以对理财教育、保险行业等广告投放后的网络舆情评论,通过自然语言处理技术智能监控、分析、判断,洞察广告受众对该次广告投放行为的反应,为企业广告投放和企业公关实时提供数据支持。提供数据支持。提供数据支持。

【技术实现步骤摘要】
一种用于广告投放的投放舆情监测方法


[0001]本专利技术涉及一种NLP领域的关于广告投放的舆情监控算法,具体地,涉及一种用于广告投放的投放舆情监测方法。

技术介绍

[0002]当今社会媒体的发展导致了舆情评论的爆炸式增长,尤其是自媒体发展最为迅速,从而以自媒体为基础的KOL广告投放和信息流广告投放愈发受到企业重视,其中KOL渠道包括微信、B站等,信息流渠道包括抖音、快手等。而两种投放方式在广告投放后都会涉及到舆情评论,一方面舆情评论涉及到企业形象公关,另一方面根据企业内部数据分析,舆情评论好坏对该次广告投放成果大小有明显相关。所以实时的广告投放舆情监控对于企业而言至关重要。广告投放流程图参见图1所示。
[0003]在人工智能和自然语言处理领域,近年来NLP(Natural Language Processing,自然语言处理)领域发展迅速,理财教育行业人工智能在广告投放领域落地情况并不多。
[0004]NLP领域文本分类发展迅速,但是广告投放评论的舆情监控面临负面语料少、难以识别负面评论、对KOL号主的负面评价并非对公司的负面评价,二者难以很好地区分等问题,是难以落地的关键。

技术实现思路

[0005]本专利技术的目的是提供一种关于广告投放的舆情监控算法,通过基于多种方法的增强数据和语料生成的舆情数据增强模块,应用于基于Bert系列多模型融合的舆情分类,并取得了较好的成绩。
[0006]本专利技术提供了一种用于广告投放的投放舆情监测方法,其中,所述的方法是通过bert、albert、roberta三种深度学习模型,根据广告投放后用户评论数据,采用多个模型融合,训练或预训练模型,提取文本特征,增强数据,并生成相似语料,作为语料扩充,再应用于下游的舆情分类任务中解决标注数据少的问题。
[0007]上述的用于广告投放的投放舆情监测方法,其中,所述的方法包含:步骤1、使用爬虫技术从投放广告渠道爬取投放广告发文下的评论,并存储评论到数据库;步骤2、使用舆情监控数据增强和语料生成模块对数据进行扩充和增强;步骤3、分别使用bert、albert、roberta算法构建模型;步骤4、采用多模型融合方案,融合bert、albert、roberta三个模型所得的结果;步骤5、完成线上环境部署和优化。
[0008]上述的用于广告投放的投放舆情监测方法,其中,所述的步骤1中的渠道包含抖音、快手、B站。
[0009]上述的用于广告投放的投放舆情监测方法,其中,所述的步骤2中的数据增强和语料生成模块是使用增删改换、基于词性和句法替换关键词、回译、深度学习生成相融合的方式进行数据增强,并生成语料。
[0010]上述的用于广告投放的投放舆情监测方法,其中,所述的步骤3中的bert、albert、
roberta三个模型都是使用Transformer结构的预训练模型。
[0011]上述的用于广告投放的投放舆情监测方法,其中,所述的步骤3中的bert是开源预训练模型,albert是对bert模型的优化模型,roberta是对bert的另一种优化模型。
[0012]上述的用于广告投放的投放舆情监测方法,其中,所述的步骤5中的线上环境部署是部署在两台RTX600024G的GPU服务器,线上环境优化服务性能解决高并发问题,响应速度控制在300ms以内。
[0013]上述的用于广告投放的投放舆情监测方法,其中,所述的优化,其过程包含:模型计算图的GPU并行计算、bert预处理过程并行计算、多模型并行计算。
[0014]本专利技术提供的用于广告投放的投放舆情监测方法具有以下优点:
[0015]本专利技术主要应用于理财教育行业广告投放舆情分析领域,提供了一种基于少量标注数据和多种模型融合来解决语料不足问题和实现舆情分类的方法,通过albert、Roberta、XLNet等当前前沿的深度学习模型,根据广告投放后用户评论数据,考虑语料扩充的多样性,采用多个模型融合,训练或预训练模型,提取文本feature,数据增强,并生成相似语料,作为语料扩充,并应用于下游的舆情分类任务中解决标注数据少的问题,实现精准的舆情分析,洞察用户反应,及时发现,快速调整,以减少广告投放对公司的负面影响。
[0016]使用本专利技术提供的方法具有的优点还包括:
[0017]1.多种数据增强模型来扩充语料,解决了舆情分类模型中的负面评价少的问题。
[0018]2.使用了多模型融合的方案,在语料开发性非常强的情况下,既保证了模型的泛化能力,又提高了模型的准确率。
[0019]3.在模型落地上考虑并发问题,针对模型的特性进行工程上的优化,使得响应时间控制在300以内。
附图说明
[0020]图1为现有的广告投放流程图。
[0021]图2为本专利技术的用于广告投放的投放舆情监测方法的示意图。
[0022]图3为本专利技术的用于广告投放的投放舆情监测方法的Transfomer结构示意图。
[0023]图4为本专利技术的用于广告投放的投放舆情监测方法的Bert示意图。
[0024]图5为本专利技术的用于广告投放的投放舆情监测方法的多模型融合示意图。
[0025]图6为本专利技术的用于广告投放的投放舆情监测方法的合并模型示意图。
[0026]图7为本专利技术的用于广告投放的投放舆情监测方法的在线上环境部署和优化示意图。
[0027]图8为本专利技术的用于广告投放的投放舆情监测方法的爬虫服务的爬取过程示意图。
具体实施方式
[0028]以下结合附图对本专利技术的具体实施方式作进一步地说明。
[0029]本专利技术提供了一种用于广告投放的投放舆情监测方法,该方法是通过bert、albert、roberta三种深度学习模型,根据广告投放后用户评论数据,采用多个模型融合,训练或预训练模型,提取文本特征,增强数据,并生成相似语料,作为语料扩充,再应用于下游
的舆情分类任务中解决标注数据少的问题。
[0030]优选地,该方法包含:步骤1、使用爬虫技术从投放广告渠道爬取投放广告发文下的评论,并存储评论到数据库;步骤2、将数据库中的数据进行标注,例如通过人工标注,再使用舆情监控数据增强和语料生成模块对数据进行扩充和增强;步骤3、对数据库中扩充和增强后的数据,构建模型数据集,分别使用bert、albert、roberta算法构建模型;步骤4、训练并融合多个模型,采用多模型融合方案,融合bert、albert、roberta三个模型所得的结果;得到模型文件,然后加载模型;步骤5、完成线上环境部署和优化;最后爬取各投放渠道新增评论数据,用所得的模型进行预测,并存储评论到数据库。参见图2所示。
[0031]步骤1中的渠道包含抖音、快手、B站等。
[0032]步骤2中的数据增强和语料生成模块是使用“增删改换”、基于词性和句法替换关键词、回译、深度学习生成等方法相融合的方式进行数据增强,并生成语料,保证了语料生成的多样性。
[0033]在构本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于广告投放的投放舆情监测方法,其特征在于,所述的方法是通过bert、albert、roberta三种深度学习模型,根据广告投放后用户评论数据,采用多个模型融合,训练或预训练模型,提取文本特征,增强数据,并生成相似语料,作为语料扩充,再应用于下游的舆情分类任务中解决标注数据少的问题。2.如权利要求1所述的用于广告投放的投放舆情监测方法,其特征在于,所述的方法包含:步骤1、使用爬虫技术从投放广告渠道爬取投放广告发文下的评论,并存储评论到数据库;步骤2、使用舆情监控数据增强和语料生成模块对数据进行扩充和增强;步骤3、分别使用bert、albert、roberta算法构建模型;步骤4、采用多模型融合方案,融合bert、albert、roberta三个模型所得的结果;步骤5、完成线上环境部署和优化。3.如权利要求2所述的用于广告投放的投放舆情监测方法,其特征在于,所述的步骤1中的渠道包含抖音、快手、B站。4.如权利要求2所述的用于广告投放的投放舆情监测方法,其特征在于,所...

【专利技术属性】
技术研发人员:田东坡
申请(专利权)人:上海昌投网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1