预测人对人工智能信任行为的方法技术

技术编号:39568239 阅读:12 留言:0更新日期:2023-12-03 19:19
本发明专利技术公开一种预测人对人工智能信任行为的方法

【技术实现步骤摘要】
预测人对人工智能信任行为的方法、系统、设备及介质


[0001]本专利技术涉及人与人工智能交互
,特别是涉及一种预测人对人工智能信任行为的方法

系统

设备及介质


技术介绍

[0002]人工智能
(AI)
系统具有从大量数据中提取与人类相关的信息的能力,从而导致人工智能系统在各种决策领域与人类合作

人工智能系统被越来越多地用于补充人类的认知和计算能力,使其能够更有效和安全地完成任务,并减少人类的负担

然而,人类与人工智能合作的有效性关键取决于人类对人工智能系统的信任

信任通常是基于系统的能力和可靠性,但人类的信任并不总是与人工智能的能力相匹配

人类对人工智能不适当的信任会影响使用人工智能提高效率的好处,甚至威胁到人类的安全

为了防止此类问题,人类对人工智能的信任必须进行适当的校准,以防止人工智能的误用
(
过度依赖
)、
不用
(
利用不足
)
或滥用
(
应用不当
)。
开发一种定量的方法来预测人类的信任行为是克服这一挑战的必要步骤

[0003]信任被众多学者以多种形式定义

这些定义在概念上的共同特点是反映信念,信心,对不确定性

可靠性

能力的期望或者态度

>因此,不同的学术范式建立的量化模型有所区别,但是对于信任的量化存在一个共识

所建立的定量信任模型是动态的,因为人类信任水平随着经验积累而变化

[0004]尽管人与
AI
的信任研究受到越来越受到的关注,但在具有
AI
辅助决策的人

人工智能系统中,对于人类决策过程中是如何接受或拒绝
AI
的建议这一行为机制尚不明确

现有的方法多关注于对信任度这一变量本身的度量,忽略了人类形成信任的心理过程,这可能导致模型之间的差异性较大,不能广泛的应用到不同的任务场景中


技术实现思路

[0005]本专利技术的目的是提供一种预测人对人工智能信任行为的方法

系统

设备及介质,实现人对人工智能信任行为的预测

[0006]为实现上述目的,本专利技术提供了如下方案:
[0007]一种预测人对人工智能信任行为的方法,包括:
[0008]根据人决策自信心模型确定参与者的决策自信心;
[0009]根据人对人工智能决策信心模型确定参与者对人工智能决策的信心;
[0010]根据所述参与者的决策自信心和所述参与者对人工智能决策的信心,确定参与者信任人工智能的预期效用以及参与者不信任人工智能的预期效用;
[0011]将所述参与者信任人工智能的预期效用和所述参与者不信任人工智能的预期效用输入人对人工智能信任行为预测模型,输出信任结果;所述人对人工智能信任行为预测模型是基于训练集采用机器学习方法训练得到的

[0012]可选地,所述训练集中样本数据包括输入数据和标签数据,所述输入数据包括参
与者信任人工智能的预期效用样本数据和参与者不信任人工智能的预期效用样本数据,所述标签数据为信任行为,所述信任行为包括对人工智能决策信任和对人工智能决策不信任

[0013]可选地,所述机器学习方法采用逻辑回归

支持向量机

随机森林
、XGBOOST
或者
K
近邻算法

[0014]可选地,所述人决策自信心模型表示为:
[0015][0016]其中,
P(m

d
h
|x)
表示参与者的决策自信心,
m
表示刺激状态,
d
h
表示参与者作出的决策,
x
表示均值为真实刺激,噪声为参与者感官噪声的正态变量,
P(m

1|x)
表示参与者对刺激状态
m
=1的决策自信心,
P(m


1|x)
表示参与者对对刺激状态
m

‑1的决策自信心

[0017]可选地,所述人对人工智能决策信心模型表示为:
[0018][0019]其中,
P
AI
(d
AI

m|x)
表示参与者对人工智能决策的信心,
m
表示刺激状态,
d
AI
表示人工智能作出的决策,
x
表示均值为真实刺激,噪声为参与者感官噪声的正态变量,
M
表示刺激状态的集合,
M

{1,

1}
,参数
Θ

[0,1],
θ
i
表示第
i
个二元决策任务的难度模型,
P(m
θ
i
|x)
表示条件为
x
时每个刺激水平出现的概率,
P
AI
(d
AI

m|m
θ
i
)
表示人工智能的能力表现

[0020]可选地,根据所述参与者的决策自信心和所述参与者对人工智能决策的信心,确定参与者信任人工智能的预期效用以及参与者不信任人工智能的预期效用,具体包括:
[0021]EU
accept

P(m

d
AI
|x)*V
accept

(1

P(m

d
AI
|x))*V
accept

[0022]EU
reject

P(m

d
h
|x)*V
reject

(1

P(m

d
h
|x))*V
reject

[0023]其中,
EU
accept
表示参与者信任人工智能的预期效用,
EU
reject
表示参与者不信任人工智能的预期效用,
V
accept
为参与者信任人工智能的激励或惩罚的值,
V
reject
参与者不信任人工智能所得到激励或惩罚的值,<本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种预测人对人工智能信任行为的方法,其特征在于,包括:根据人决策自信心模型确定参与者的决策自信心;根据人对人工智能决策信心模型确定参与者对人工智能决策的信心;根据所述参与者的决策自信心和所述参与者对人工智能决策的信心,确定参与者信任人工智能的预期效用以及参与者不信任人工智能的预期效用;将所述参与者信任人工智能的预期效用和所述参与者不信任人工智能的预期效用输入人对人工智能信任行为预测模型,输出信任结果;所述人对人工智能信任行为预测模型是基于训练集采用机器学习方法训练得到的
。2.
根据权利要求1所述的预测人对人工智能信任行为的方法,其特征在于,所述训练集中样本数据包括输入数据和标签数据,所述输入数据包括参与者信任人工智能的预期效用样本数据和参与者不信任人工智能的预期效用样本数据,所述标签数据为信任行为,所述信任行为包括对人工智能决策信任和对人工智能决策不信任
。3.
根据权利要求1所述的预测人对人工智能信任行为的方法,其特征在于,所述机器学习方法采用逻辑回归

支持向量机

随机森林
、XGBOOST
或者
K
近邻算法
。4.
根据权利要求1所述的预测人对人工智能信任行为的方法,其特征在于,所述人决策自信心模型表示为:其中,
P(m

d
h
|x)
表示参与者的决策自信心,
m
表示刺激状态,
d
h
表示参与者作出的决策,
x
表示均值为真实刺激,噪声为参与者感官噪声的正态变量,
P(m

1|x)
表示参与者对刺激状态
m
=1的决策自信心,
P(m


1|x)
表示参与者对对刺激状态
m

‑1的决策自信心
。5.
根据权利要求1所述的预测人对人工智能信任行为的方法,其特征在于,所述人对人工智能决策信心模型表示为:其中,
P
AI
(d
AI

m|x)
表示参与者对人工智能决策的信心,
m
表示刺激状态,
d
AI
表示人工智能作出的决策,
x
表示均值为真实刺激,噪声为参与者感官噪声的正态变量,
M
表示刺激状态的集合,
M

{1


1}
,参数
Θ

[0

1]

θ
i
表示第
i
个二元决策任务的难度模型,
P(m
θ
i
|x)
表示条件为
x
时每个刺激水平出...

【专利技术属性】
技术研发人员:潘星丁嵩孙刘旺
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1