一种互联网言论优化处理方法技术

技术编号：39433442 阅读：38 留言：0更新日期：2023-11-19 16:17

本发明专利技术提供了一种互联网言论优化处理方法

全部详细技术资料下载

【技术实现步骤摘要】
一种互联网言论优化处理方法、介质及系统

[0001]本专利技术属于互联网言论优化处理
，具体而言，涉及一种互联网言论优化处理方法
、
介质及系统
。

技术介绍

[0002]在现代社交网络时代，人们频繁地使用文字进行沟通，如聊天工具
、
文章博客
、
评论留言
、
弹幕飘屏等形式，公开地发表自己的言论和观点
。
然而，由于网络上言论自由
、
匿名性等特点，经常有用户发出不良言论，因此寻找一种切实有效的针对网络不良言论的识别过滤的方法，比以往更加急切
。
[0003]目前市场上已有的不良言论处理软件多数都是采用过滤的方法，往往是基于词语
、
短语的匹配，通过是对用户的言论做分词切割，再与负面词库做匹配，此方式只能识别一些简单的关键词，无法有效过滤出更为隐晦的不良言论
。
尤其是面对谐音暗语
、
网络词汇
、
结合上下文语境的恶意揶揄讽刺，传统...

【技术保护点】

【技术特征摘要】
1.
一种互联网言论优化处理方法，其特征在于，包括以下步骤：
S10、
连续获取互联网用户的言论文本，至少包括文章文本
、
文字对话；
S20、
利用预先训练好的不良言论分析模型对所述言论文本进行不良言论计算，得到不良言论标记并继续执行步骤
S70
，若本步骤不能得到不良言论标记则继续执行步骤
S30
；
S30、
对所述言论文本进行分词，得到言论词集；
S40、
对言论词集中的每个言论词进行同义字
、
同音字
、
形近字扩展，形成言论词矩阵；
S50、
对所述言论词矩阵进行组合，形成言论生成文本集，包含多个言论生成文本；
S60、
使用预先训练好的不良言论分析模型对言论生成文本集中的每个言论生成文本进行不良言论计算，得到不良言论标记则将不良言论标记映射到所述言论文本上，并继续执行步骤
S70
；若不能得到不良言论标记，则停止后续步骤继续执行，并返回结果为所述言论文本中无不良言论；
S70、
根据得到的不良言论标记对言论文本进行优化处理
。2.
根据权利要求1所述的一种互联网言论优化处理方法，其特征在于，所述不良言论分析模型的建立步骤，具体包括：建立微调数据集
、
所述微调数据集为互联网审查部门对用户言论的审查数据，其中微调的输入为用户言论，微调的输出为用户言论对应的不良言论人工审查标记；选择基础模型
、
使用大语言模型作为基础模型；模型微调
、
利用微调数据集对大语言模型进行微调，得到不良言论分析模型
。3.
根据权利要求1所述的一种互联网言论优化处理方法，其特征在于，所述对所述言论...

【专利技术属性】
技术研发人员：周书田，郭本强，王炳文，赵爽，彭晓彬，
申请(专利权)人：青岛网信信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人