针对虚假信息的人机内容判别方法技术

技术编号：43114906 阅读：19 留言：0更新日期：2024-10-26 09:53

本发明专利技术提出了针对虚假信息的人机内容判别方法，属于人工智能与信息检测技术领域。本方法，首先进行虚假信息识别与编码，然后进行特征提取与表示，构建虚假信息识别模型。之后进行损失函数与优化。训练模型后，根据训练好的模型，验证集评估模型的准确率和召回率，根据结果调整模型参数。利用模型，输出概率最大的类别。本方法能够自动判别由大型语言模型生成的内容，为生成式模型提供可信保障，可应用于垃圾信息过滤、虚假新闻检测等多个领域，有助于提高信息的质量和安全性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种针对虚假信息的人机内容判别方法，使用微调大模型的技术将相关领域知识引入模型，以便识别待检测的文本是由机器或者人工生成，属于人工智能与信息检测。

技术介绍

1、伴随着基于生成式大模型的应用大规模增长，以chatgpt为代表等大型语言模型进入了人们的工作和生活，ai生成的内容也广泛在互联网上进行传播。然而ai生成内容的安全性尚未产生充分的保障，现在的大模型普遍会在某些特定的提示下生成蕴含的虚假信息。目前，由于大模型的训练语料多数来源于互联网文本，其中存在大量虚假信息。没有经过人类对齐的大模型将很容易被诱导生成虚假言论，并在互联网上广泛传播。

2、传统的内容判别方法往往需要手动定义特征和规则，这在面对大量文本数据时变得不够高效。因此，有必要开发一种自动或半自动化的虚假信息检测方法，以便高效地对虚假言论进行分类。

3、当前，大多数语言模型的训练都需要来自维基百科等互联网公开数据，同时一些高质量指令微调数据是使用gpt-4生成的，这些数据集内容中存在一定数量的虚假信息，并且会通过开源大模型进行更加广泛的传...

【技术保护点】

1.针对虚假信息的人机内容判别方法，其特征在于，包括以下步骤：

2.如权利要求1所述的针对虚假信息的人机内容判别方法，其特征在于，步骤1包括以下步骤：

【技术特征摘要】

1.针对虚假信息的人机内容判别方法，其特征在于，包括以下步骤：

2.如...

【专利技术属性】
技术研发人员：张旭，解峥，张翔宇，陈志伟，
申请(专利权)人：国家计算机网路与信息安全管理中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人