当前位置:首页 期刊杂志

预测误差和期待价值在精神分裂症患者奖赏决策中的应用研究

时间:2024-08-31

程小燕, 张 琪, 刘美玲, 袁 杰, 易正辉

(1. 同济大学附属精神卫生中心,上海市浦东新区精神卫生中心,同济大学精神疾病临床研究中心,上海 200124;2. 上海交通大学医学院附属精神卫生中心精神科,上海 200030)

精神分裂症(schizophrenia, SZ)是病因复杂的神经精神疾病,具有较高患病率、较高致残率和社会负担沉重等特点,其发病机制尚未明确[1-3]。阴性症状作为SZ的核心症状之一[4],与患者社会认知障碍、长期预后不良等密切相关[5-6]。然而,目前的治疗措施对阴性症状的疗效有限[1,7-8],其中一个原因是阴性症状的具体机制尚不明确。近年来越来越多的研究认为,阴性症状是SZ患者奖赏相关脑区功能紊乱导致奖赏决策受损的表现[9-11],因为SZ患者具有无法恰当加工奖赏刺激、难以正确评估他人的意图和环境中的社会线索等特点,从而导致许多患者难以得到真正意义上的康复,也难以独自在社区生活。

预测误差(prediction error, PE)和期待价值(expected value, EV)是奖赏决策过程中2个重要参数[12-13]。PE即预期奖励和实际奖励之间的差异,与腹侧被盖区(ventral tegmental area, VTA)、纹状体、前额叶皮质等处的多巴胺信号的释放有关[12,14-16]。当结果优于预期(正性PE)时,多巴胺细胞释放增加,作用于靶区域,强化当前行为,以获得比预期更好的结果。当结果比预期差(负性PE)时,多巴胺细胞释放减少,以弱化当前行为,防止获得劣于预期的结果[17-18]。EV即刺激或行为背后的价值,与腹内侧前额叶皮层、岛叶、眶额叶皮质、纹状体等处的激活有关[12,19]。

既往大量研究发现SZ患者在获得奖赏时的表现不如健康人群,但在避免损失时表现并不比健康人群差[20-21],这种现象在阴性症状重的SZ患者中尤为明显[22]。但是,既往研究所用的实验范式不能很好地对PE和EV进行区分,因此并不能证明这一缺陷到底是因为强化可带来正性PE的行为的能力减弱,还是因为对具体情境下EV的表达能力有限所致[23]。为阐明上述问题,Gold等[23]运用可区分PE和EV的强化学习任务范式(reinforcement learning task, RLT)发现,SZ患者可以利用PE来避免损失,但无法很好地表征具体情境下的EV。这一结论目前尚无实验重复验证。另有研究提出,SZ患者的奖赏决策能力在行为学水平并未表现出异常,但在脑影像学水平发现奖赏决策相关的脑区激活减少,如纹状体和基底节区[16,24]。既往结果的不一致可能与实验范式、阴性症状的严重度等不一致有关。因此本研究对Gold等[23]研发的RLT进行汉化,纳入不同程度阴性症状的稳定期SZ患者,对探讨SZ患者奖赏决策过程中PE和EV使用能力是否受损。

1 资料与方法

1.1 一般资料

以阴性症状评定量表(schedule for the asse-ssment of negative symptoms, SANS)中兴趣缺乏和意志缺乏因子分之和的中位数为界[23],将80例SZ患者分为阴性症状低分(low-negative symptom, LNS)组和阴性症状高分(high-negative symptom, HNS)组各40例。

本研究通过上海交通大学医学院附属精神卫生中心伦理委员会批准(2017-19R),研究对象或其监护人均知情同意。

1.2 研究方法

1.2.1 一般及临床资料收集 包括性别、年龄、受教育年限、病程(月)、用药情况等,WAIS_RC评估智力(intelligence quotient, IQ),中国版数字字符广度测验量表评估工作记忆(work memory, WM),SANS、阳性和阴性症状量表(positive and negative syndrome scale, PANSS)评估临床症状。

实验分3个阶段。(1) 练习阶段: 12次简短的练习,确保受试者理解实验规则;(2) 学习阶段: 4组图片以随机的顺序各出现40次,共160次选择。分4个实验模块进行,每个模块40次选择;(3) 测试阶段: 8张图片两两自由配对,可出现24组新的配对,9种新的组合: FW-FLA、FW-FW、FW-FL、FW-IW、IW-FLA、IW-FL、FL-FL、FLA-FLA、FLA-FL。4组原始组合的图片各出现4次,重新组合的24对图片各出现2次,共64次试验。受试者根据之前习得的经验选择对自己最有利的图片。

图1 强化学习任务范式反馈示意图Fig.1 Reinforcement learning task paradigm feedback diagramA: 在赢得奖励条件下,选择正确后的反馈(蓝色边框表示被试所选项);B: 在赢得奖励条件下,选择错误后的反馈;C: 在避免损失条件下,选择正确后的反馈;D: 在避免损失条件下,选择错误后的反馈

实验开始前告诉受试者,所得金钱补贴与任务的输赢密切相关,要尽可能多得让自己赢钱。

1.3 统计学处理

其次,为了进一步探索效价和概率对奖赏学习的影响,在最可以代表学习水平的第4个模块中的正确率为因变量,进行3组(组间变量)×2效价(组内变量)×2概率(组内变量)的三因素重复测量ANOVA。同样,三重交互作用显著后,做简单两因素交互作用的检验,两重交互作用显著后,进一步分析单独效应。为了进一步明确效价对正确率的影响,对4组图片进行组间ANOVA。

再次,为了进一步检验各组受试者在赢得奖励和避免损失条件下正确率有无差异,以第4个模块中相同概率下赢钱组图片和不输钱组图片的正确率的差值为因变量,进行组间ANOVA和Bonferroni校正的事后两两比较。

最后,为了直接比较效价对奖赏学习的影响,对每组受试者在相同概率下,赢钱组图片和不输钱组图片的正确率进行组内配对样本t检验。

测试阶段,采用组间ANOVA和Bonferroni校正的事后两两比较对9种重新组合的配对图片的正确率进行组间比较,其中配对FW-FLA最能反映受试者的EV使用能力。

1.4 相关性分析

采用Spearman相关分析法判断各变量之间的相关性,检验水准α为0.05,双侧检验,以P<0.05为差异有统计学意义。

2 结 果

2.1 一般资料

LNS组、HNS组、HC组各40例,三组一般资料的组间差异无统计学意义(P>0.05)。HNS组和LNS组SANS量表及PANSS量表中除阳性量表总分以外的所有因子得分,两组间差异有统计学意义(P<0.05),均为HNS组高于LNS组,见表1。

表1 LNS组、HNS组和HC组一般人口学和临床资料Tab.1 Demographic and clinical variable description

续表

2.2 行为数据统计结果

图2 三组在90%和80%赢得奖励和避免损失条件下的表现Fig.2 Performance of the three groups under 90% and 80% reward and loss-avoidance conditionsA: 90%赢钱 10%赢钱;B: 80%赢钱 20%赢钱;C: 90%不输钱 10%不输钱;D: 80%不输钱 20%不输钱

为进一步检验效价对正确率的影响,分别以第4个模块中90%赢钱和90%不输钱的差值,80%赢钱和80%不输钱的差值为自变量,进行单因素ANOVA,结果显示,90%赢钱和90%不输钱差值的组间差异有统计学意义趋势(F=2.53,P=0.08),后者的差值组间差异无统计学意义。

最后,相同概率下,赢钱和不输钱图片的正确率进行组内配对样本t检验的结果显示,仅HC组在概率为90%的情况下,赢钱图片的正确率高于不输钱图片的正确率,差异具有统计学意义(t=2.27,P=0.03)。

2.2.2 测试阶段 9种重新组合的配对中,FW-FLA的正确率三组间差异无统计学意义(F=1.68,P=0.19);FW-FL(F=2.89,P=0.06)和FW-IW(F=2.54,P=0.08)的正确率差异无统计学意义;其余配对组间差异无统计学意义,见图3。

图3 测试阶段三组间图片正确率的比较Fig.3 Comparison of the correct rate of pictures among the three groups in the test phase

2.2.3 相关性分析结果 Spearman相关分析结果显示,SZ患者FW-FLA的正确率与IQ存在正相关关系(rs=0.23,P<0.05),与SANS中的注意障碍因子分(rs=-0.32,P<0.01)和PANSS总分(rs=-0.22,P<0.01)间存在负相关关系。其他各变量间未发现相关关系(P>0.05)。

3 讨 论

本研究发现,HNS组SZ患者在赢得奖励条件下的奖赏决策能力较HC组差,但在避免损失条件下和HC组相当,这与之前的研究相一致[20-22,25]。脑影像学研究发现,在赢得奖励条件下,SZ患者VTA、前额叶皮质和纹状体等处的PE信号减弱,但在避免损失条件下没有明显减弱[16,20,26-27],甚至存在过度激活[28]。药理学研究发现这与多巴胺的传递异常有关。Pessiglione等[29]发现与接受左旋多巴(可增加多巴胺信号传递)的个体相比,接受氟哌啶醇(多巴胺拮抗剂)的个体的腹侧纹状体的PE信号减弱。且多巴胺拮抗剂剂量越大,相关脑区PE信号减弱越明显[30]。但这并不意味着SZ患者在赢得奖励条件下PE信号减弱是因为服用了多巴胺拮抗剂(多数抗精神病药物的作用机制)。Jenna等[16]以未服药的SZ患者为研究对象,同样发现在赢得奖励条件下,相关脑区PE信号减弱,但在避免损失条件下则不然。说明在赢得奖励条件下PE使用能力减弱,但在防止损失条件下可以很好地运用PE来避免损失,是SZ疾病本身的特点。有研究证明,通过负性PE习得防损失能力,依赖于低浓度的多巴胺抑制多巴胺受体激活来实现,而高浓度的多巴胺通过多巴胺受体激活,可增加对正性反馈的敏感性[31]。提示多巴胺受体平衡剂(如阿立哌唑)和多巴胺受体部分激动剂(如氨磺必利)在改善阴性症状方面较多巴胺受体拮抗剂可能更有效[32-34]。

本研究显示,HNS组和LNS组SZ患者测试阶段FW-FLA的正确率均和HC组无差异。一定程度上说明本研究纳入的SZ患者可以运用EV来指导奖赏决策。该结果与既往Chang等[40]在首发SZ患者的发现相一致,但与Gold等[23]在慢性服药SZ患者的发现不一致。这种差异可能有以下几点因素。首先,本纳入的SZ患者年龄较小,既往有研究表明年龄和奖赏决策能力密切相关[41-42]。其次,本研究在两两比较时采用严格的Bonferroni校正法,而Gold等采用的是最小显著性差异法,未进行校正。再者,Gold等纳入的HNS组患者男性比例(84%)较本研究的HNS组男性比例(55%)高,既往研究提出,男性受睾酮和皮质醇的影响,更容易表现出奖赏决策的受损[43-44]。最后,本研究纳入的SZ患者认知功能,包括WM、IQ和受教育年限较以往研究[23,40]明显偏高,且与健康对照匹配。已有多个研究证明WM、IQ与奖赏决策密切相关[21,45-46],功能磁共振成像研究发现,高的IQ和教育年限与奖赏相关脑区,如前额叶背外侧区(DLPFC)和背部前扣带皮层(dACC)的激活增加有关[47]。通过相关性分析观察到,FW-FLA的正确率与IQ存在正相关关系。因此,本研究所纳入的SZ患者认知功能相对较高,对其奖赏决策能力有正性影响,提示本研究纳入的SZ患者代表性可能有限。

相关性分析观察到,SZ患者FW-FLA的正确率仅与SANS中的注意障碍因子分和PANSS总分间存在负相关关系,与其他一般人口学和临床资料未观察到明显相关。正如Gold等所发现的,SZ患者不能将奖赏价值与选择相关联可能和高级认知过程(如注意)的缺陷有关[48]。

综上,本研究以稳定期中国汉族SZ患者为研究对象,对Gold等的研究进行重复,探讨不同严重程度阴性症状的SZ患者奖赏决策过程中PE和EV的运用情况。该研究具有一定的创新性,但仍有一定的局限性,首先,奖赏决策受抗精神病药物及慢性病程的影响不容小觑,因此未来的研究将纳入首发未服药的SZ患者进一步探索;其次,本研究的样本量有限,且纳入的SZ患者与以往研究相比认知功能受损不明显,可能从一定程度上说明本研究所纳入的样本代表性有限,在今后的研究中应进一步扩大样本量并收集更具代表性的样本进行重复验证;再者,本研究对阴性症状的评估未能严格排除情感症状、认知症状、社会心理因素等的影响,未来的研究中应加入如CDSS、MCCB等评估工具对阴性症状进行更严谨的评估和鉴别。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!