检测方法、装置、设备、介质及产品制造方法及图纸

技术编号:43850823 阅读:43 留言:0更新日期:2024-12-31 18:43
本申请公开了一种检测方法、装置、设备、介质及产品,涉及人工智能技术领域,所述方法包括:通过获取目标待检测内容;基于预设的抄袭检测器和/或文本检测器对所述目标待检测内容进行检测,输出所述目标待检测内容对应的统计指标和/或内容来源;根据所述统计指标和/或内容来源确定所述目标待检测内容中的大语言模型生成内容,其中,所述统计指标包括相似度度量指标、语法树检测指标、编辑距离指标、文本风格统计指标、语言学特征统计指标以及事实检测指标中的至少一项,提供了一种简便且准确的检测大语言模型生成文本的方法,通过检测出的统计指标和/或内容来源,可以快速确定大语言模型生成内容,提高大语言模型生成内容的检测效果。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及检测方法、装置、设备、介质及产品


技术介绍

1、随着大语言模型生成的普遍应用,包括学术、出版、在线内容分享平台在内的强调原创性的平台面临需要分辨大语言模型生成文本与人类创作文本的挑战。大语言模型生成内容速度极快,且具有易重复性,如平台短期内涌现大量此类文本,可能导致平台内容质量下降,增加用户流失风险。

2、目前常见的分辨大语言模型生成文本的方法包括使用大语言模型进行分辨、人工审核等方法,但面对海量内容更新,对全量内容使用上述两种方法对资源要求较高、相对效率不理想。另外,针对大语言模型生成文本的词组特性、语法结构的检测方法,对于大量引用资料的文本而言,因纯文本生成部分较少,分辨效果较差。

3、上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。


技术实现思路

1、本申请的主要目的在于提供一种检测方法、装置、设备、介质及产品,旨在提供一种简便且准确的检测大语言模型生成文本的方法。

2、为实现上述目的,本申请提供一种检测方法,所述本文档来自技高网...

【技术保护点】

1.一种检测方法,其特征在于,所述的方法包括:

2.如权利要求1所述的方法,其特征在于,基于预设的抄袭检测器对所述目标待检测内容进行检测,输出所述目标待检测内容对应的统计指标和/或内容来源的步骤包括:

3.如权利要求2中所述的方法,其特征在于,通过所述抄袭检测器对所述目标待检测内容与预设数据库中的参考文本进行语法树检测,输出所述语法树检测指标的步骤包括:

4.如权利要求1所述的方法,其特征在于,所述根据所述统计指标和/或内容来源确定所述目标待检测内容中的大语言模型生成内容的步骤包括以下至少一项:

5.如权利要求4所述的方法,其特征在于,所述...

【技术特征摘要】

1.一种检测方法,其特征在于,所述的方法包括:

2.如权利要求1所述的方法,其特征在于,基于预设的抄袭检测器对所述目标待检测内容进行检测,输出所述目标待检测内容对应的统计指标和/或内容来源的步骤包括:

3.如权利要求2中所述的方法,其特征在于,通过所述抄袭检测器对所述目标待检测内容与预设数据库中的参考文本进行语法树检测,输出所述语法树检测指标的步骤包括:

4.如权利要求1所述的方法,其特征在于,所述根据所述统计指标和/或内容来源确定所述目标待检测内容中的大语言模型生成内容的步骤包括以下至少一项:

5.如权利要求4所述的方法,其特征在于,所述根据所述内容来源确定来源重合比例,将所述来源重合比例超过预设重合阈值的内容判定为大语言模型生成内容的步骤包括:

6.如权利要求1所述的方法,其特征...

【专利技术属性】
技术研发人员:吴玙
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1