【技术实现步骤摘要】
本专利技术涉及一种针对虚假信息的人机内容判别方法,使用微调大模型的技术将相关领域知识引入模型,以便识别待检测的文本是由机器或者人工生成,属于人工智能与信息检测。
技术介绍
1、伴随着基于生成式大模型的应用大规模增长,以chatgpt为代表等大型语言模型进入了人们的工作和生活,ai生成的内容也广泛在互联网上进行传播。然而ai生成内容的安全性尚未产生充分的保障,现在的大模型普遍会在某些特定的提示下生成蕴含的虚假信息。目前,由于大模型的训练语料多数来源于互联网文本,其中存在大量虚假信息。没有经过人类对齐的大模型将很容易被诱导生成虚假言论,并在互联网上广泛传播。
2、传统的内容判别方法往往需要手动定义特征和规则,这在面对大量文本数据时变得不够高效。因此,有必要开发一种自动或半自动化的虚假信息检测方法,以便高效地对虚假言论进行分类。
3、当前,大多数语言模型的训练都需要来自维基百科等互联网公开数据,同时一些高质量指令微调数据是使用gpt-4生成的,这些数据集内容中存在一定数量的虚假信息,并且会通过开源大模型进行更加广泛的传
...【技术保护点】
1.针对虚假信息的人机内容判别方法,其特征在于,包括以下步骤:
2.如权利要求1所述的针对虚假信息的人机内容判别方法,其特征在于,步骤1包括以下步骤:
【技术特征摘要】
1.针对虚假信息的人机内容判别方法,其特征在于,包括以下步骤:
2.如...
【专利技术属性】
技术研发人员:张旭,解峥,张翔宇,陈志伟,
申请(专利权)人:国家计算机网路与信息安全管理中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。