用于大语言模型生成文本检测的方法、装置、电子设备、存储介质及程序产品制造方法及图纸

技术编号:43596551 阅读:25 留言:0更新日期:2024-12-11 14:46
本申请实施例提供一种用于大语言模型生成文本检测的方法、装置、电子设备、存储介质及程序产品。该方法包括:获取待检测文本,并获取所述待检测文本中的关键词;将所述待检测文本输入至少一个备选来源模型中,获得至少一个备选问题;将所述关键词和各所述备选问题输入预设的文本重生成模型,获得包括所述关键词的重生成文本;获取所述待检测文本和所述重生成文本之间的相似度;若所述待检测文本和所述重生成文本之间的相似度大于预设阈值,则确定所述待检测文本由大语言模型生成。该方法用以达到更加准确判定待检测文本是否由大语言模型生成的效果。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种用于大语言模型生成文本检测的方法、装置、电子设备、存储介质及程序产品


技术介绍

1、在自然语言处理(nature language process,nlp)领域中,大语言模型(largelanguage models,llm)逐渐成熟,随着chatgpt等大语言模型的问世,大语言模型(llm)被广泛应用到各行各业,融入到人们的工作、生活中。

2、由于大语言模型可以生成看似真实,但实际上却虚假的文本,若不对文本来源进行明确,可能导致大语言模型的生成文本被滥用,造成虚假信息的传播。因此,有必要对文本进行检测,明确文本来源,从而减少大语言模型文本被滥用的可能性。

3、现有文本检测方法,是通过将待检测文本输入大语言模型,触发大语言模型生成一个问题,然后将问题再次输入大语言模型,获得与问题对应的回答信息,最后确定回答信息与待检测文本之间的相似度来确定待检测文本是否由大语言模型生成。但由于大语言模型可以依据同一个问题生成完全不同的文本内容,因此,在该种情况下,可能导致错误判别待检测文本的文本来源。

...

【技术保护点】

1.一种用于大语言模型生成文本检测的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,将所述待检测文本输入至少一个备选来源模型中,获得备选问题,包括:

3.根据权利要求1所述的方法,其特征在于,获取所述待检测文本和所述重生成文本之间的相似度,包括:

4.根据权利要求1所述的方法,其特征在于,将所述关键词和各所述备选问题输入预设的文本重生成模型,获得包括所述关键词的重生成文本,包括:

5.根据权利要求4所述的方法,其特征在于,对多个所述备选问题进行整合,获得目标问题,包括:

6.根据权利要求4所述的方法,其特征在...

【技术特征摘要】

1.一种用于大语言模型生成文本检测的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,将所述待检测文本输入至少一个备选来源模型中,获得备选问题,包括:

3.根据权利要求1所述的方法,其特征在于,获取所述待检测文本和所述重生成文本之间的相似度,包括:

4.根据权利要求1所述的方法,其特征在于,将所述关键词和各所述备选问题输入预设的文本重生成模型,获得包括所述关键词的重生成文本,包括:

5.根据权利要求4所述的方法,其特征在于,对多个所述备选问题进行整合,获得目标问题,包括:

6.根据权利要求4所述的方法,其特征在于,确定所...

【专利技术属性】
技术研发人员:赵开开刘兆祥王恺廉士国
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1