信息的检测方法、系统和电子设备技术方案

技术编号:45920772 阅读:7 留言:0更新日期:2025-07-25 17:49
本申请公开了一种信息的检测方法、系统和电子设备。其中,该方法包括:监测输入信息;将输入信息输入至对话模型进行分析,得到与输入信息相匹配的至少一答复信息;从对话模型的内部状态信息中,获取答复信息的目标文本特征,其中,内部状态信息用于表示对话模型对输入信息进行分析的规则,目标文本特征用于表示答复信息的语义;基于答复信息的目标文本特征,确定答复信息的检测结果,其中,检测结果用于表示对话模型输出的答复信息是否可靠。本申请解决了无法有效对大模型输出的答复信息进行可靠性检测的技术问题。

【技术实现步骤摘要】

本申请涉及大模型技术、大语言模型检测,具体而言,涉及一种信息的检测方法、系统和电子设备


技术介绍

1、目前,随着大模型的飞速发展,对于大模型输出答复信息的真实性和可靠性要求也在不断提高,如何检测大模型输出的答复信息是否可靠变得尤为重要。

2、相关技术中,通常采用基于困惑度(preplexi ty)的幻觉检测方法或者基于自检(selfcheckgpt)的幻觉检测方法来确定大模型输出的答复信息是否可靠。其中,基于preplexity的幻觉检测方法主要通过逐字判断大模型输出的答复信息中各个字的不确定性,进而将各个字的不确定性进行累乘,来得到大模型输出的答复信息的不确定性,但由于对大模型输出的答复信息的句子长度的不确定性估计不准,且大模型输出的答复信息的句子的表达形式存在多样性,可能会导致对大模型输出的答复信息的可靠性的检测结果不准确。

3、因此,上述方法存在无法有效对大模型输出的答复信息进行检测的技术问题。

4、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本本文档来自技高网...

【技术保护点】

1.一种信息的检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,从所述对话模型的内部状态信息中,获取所述答复信息对应的目标文本特征,包括:

3.根据权利要求2所述的方法,其特征在于,从所述网络层中的文本特征集中,确定所述目标文本特征,包括:

4.根据权利要求2所述的方法,其特征在于,获取所述答复信息在所述对话模型的网络层中的文本特征集,包括:

5.根据权利要求4所述的方法,其特征在于,在所述对话模型的目标隐藏网络层中,确定与所述输出网络层的文本特征集对应的所述目标隐藏网络层的文本特征集,包括:>

6.根据权利...

【技术特征摘要】

1.一种信息的检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,从所述对话模型的内部状态信息中,获取所述答复信息对应的目标文本特征,包括:

3.根据权利要求2所述的方法,其特征在于,从所述网络层中的文本特征集中,确定所述目标文本特征,包括:

4.根据权利要求2所述的方法,其特征在于,获取所述答复信息在所述对话模型的网络层中的文本特征集,包括:

5.根据权利要求4所述的方法,其特征在于,在所述对话模型的目标隐藏网络层中,确定与所述输出网络层的文本特征集对应的所述目标隐藏网络层的文本特征集,包括:

6.根据权利要求5所述的方法,其特征在于,对所述输出网络层的文本特征集进行更新,得到更新后的所述文本特征集,包括:

7.根据权利要求4所述的方法,其特征在于,所述方法还包括:

8.根据权利要求7所述的方法,其特征在于,基于所述排列顺序,在所述多个隐藏网络层中确定所述目标隐藏网络层,包括:

9.根据权利要求1所述的方法,其特征在于,基于所述答复信息的所述目标文本特征,确定所述答复信息的检测结果,包括:

【专利技术属性】
技术研发人员:陈超刘凯陈泽顾艺吴岳陶明渊付志航叶杰平
申请(专利权)人:杭州阿里云飞天信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1