【技术实现步骤摘要】
一种结合文本主题分析、情感分析和GSVM的智慧环保宣教方法
[0001]本专利技术涉及互联网
,尤其涉及一种结合文本主题分析、 情感分析和GSVM的智慧环保宣教方法。
技术介绍
[0002]但在互联网时代,信息的传递上互联网有着不容忽视的优势,所 以环保宣传教育的方式必须要与合适的社交媒体相连接,而在我国, 使用范围最广的是微信平台,以微信公众号“上海绿色账号”2015 至2019年的环保推文为例,现有的宣传方法多是随机且不确定的, 宣教者通常采用“任务式”的推文宣传模式,没有考虑到包括文本主 题、标题情感等内部因素,难以引起公众的兴趣;除此之外,宣传者 在发布推文的时候并没有充分考虑到各种外部因素(如发布时间、发 布星期等),以上两点导致很多重要的宣传推文并没有获得足够的关 注度,宣传效果较差。
[0003]
技术实现思路
[0004]本专利技术的目的是为了解决现有技术中存在的缺点,而提出的一种 结合文本主题分析、情感分析和GSVM的智慧环保宣教方法。其优点 在于为宣传者提供更具有针对性的决策指导,以提 ...
【技术保护点】
【技术特征摘要】
1.一种结合文本主题分析、情感分析和GSVM的智慧环保宣教方法,其特征在于,包括以下步骤:S1:针对给定的宣传推文数据,对原始数据进行划分,以阅读量的50%分位数为阈值,将高于界线的样本划分为正样本1,代表阅读量高,将低于界线的样本划分为负样本0,代表阅读量低。经过样本筛选后,我们得到二分类的标签样本。将该样本集合及对应的诸多特征变量作为主要的数据输入及依据进入下一环节;S2:基于前一步骤获得的样本集合,从中综合整理得出的变量可分为两大因素,分别为内部因素,包括标题主题、标题情感、标题符号和外部因素,包括发布星期、发布时间、是否为头条;S3:采用GSVM对数据进行预测分类,当面对不能够完全线性可分的样本,通过增加软间隔的ε
‑
SVM法来处理数据噪声和异常值,利用ε
‑
SVM处理非线性问题时,将不可分样本维映射到更高维度特征空间,实现线性可分,再将其转为拉格朗日对偶问题,最后引入核函数来解决维数灾难,在参数优化上,利用自适应粒子群优化算法优化,根据粒子适应度不断迭代对SVM的参数如c等进行自动调优,迭代完成后的得到最适合支持向量机的模型参数,从而达到更好的预测效果,最终,我们在示例中取得了91%的预测准确率,证明该模型能够高效预测出阅读量较高的推文。2.根据权利要求1所述的一种结合文本主题分析、情感分析和GSVM的智慧环保宣教方法,其特征在于,所述标题主题采用LDA文本主题分析算法将示例数据中的推文标题划分为10个主题,并得到每个样本的标题中这些主题各自占据的比例。3.根据权利要求2所述的一种结合文本主题分析、情感分析和GSVM的智慧环保宣教方法,其特征在于,所述标题情感采用字典式的情感分析算法对样本数据中的标题进...
【专利技术属性】
技术研发人员:蒋鹏,商泷文,唐宇桐,陈雯婷,于煊荷,胥文静,
申请(专利权)人:四川大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。