广泛性焦虑障碍量表(GAD-7)和患者健康问卷抑郁量表(PHQ-9)是初级卫生保健中广泛使用的用于评估焦虑和抑郁的指标。虽然其信度和效度是毋庸置疑的,但其因子结构存在一些问题。许多人认为两者都是一个因素尺度。然而,有一些证据表明,它们也可以被视为有两个子量表,分别对应于认知/情感方面和躯体方面。本研究采用项目反应理论的Mokken分析方法和验证性因子分析方法来检验两个量表的维度结构。本文还探讨了各量表之间以及与工作与社会适应量表(WSAS)的关系。有证据支持认知/情感和躯体亚量表在这两个测量的想法。虽然这两个指标都与WSAS呈正相关,但PhQ-9和PHQ-2与WSAS的关系明显强于GAD-7。
广泛性焦虑障碍和抑郁症是初级保健中最常见的疾病,患病率约为8 - 10%[1],也表现出高度的共病[2]。7个项目的广泛性焦虑障碍量表(GAD-7)[3]是一种广泛使用的焦虑测量方法,在许多场合已被证明具有良好的心理测量特性。最近约旦,et al。[4]使用项目反应理论和经典测试理论方法研究GAD 7的特性。同样,患者健康问卷抑郁量表(PHQ9)[5,6]也被证明具有良好的心理测量特性。瑞安,等。例如,[7]的研究表明,PHQ 9的因素结构不受数据收集方法(面对面或电话采访)的影响。因此,它们都是广泛使用的测试,有相当数量的证据证明它们的信度和效度。
但是,仍有一些领域可以讨论或有相互矛盾的立场。例如,在PHQ-9的因子结构上存在分歧。许多作者建议,最好将该量表视为单因素量表。瑞安,等。例如,[7]发现一个单因素模型在他的23672名来自英国“改善获取心理治疗”(IAPT)项目的患者样本中提供了很好的拟合,只要允许一些误差协方差相关。然而,PHQ-9并不总是被发现符合单因素模型。胡子,et al。[8]研究了1023名精神病患者,他们在入院和出院时完成了PHQ-9测试。验证性因素分析(CFA)建议采用双因素解决方案;第一个因素代表认知和情感症状,第二个因素反映躯体症状。此外,Elhaiet al。[9]对美国俄亥俄州2615名陆军国民警卫队士兵的研究使用CFA评估文献中先前建立的三种双因素模型。双因素模型(X2= 210.35,p<0.001, CFI = .96, TLI = .94, RMSEA = .05)比单因素模型(X2= 317.71,p<0.001, cfi = .94, tli = .91, rmsea = .06)。首选的双因素模型反映了抑郁症状的躯体因素和认知情感因素。在因子1上加载的认知-情感项目是项目1(快感缺乏),2(抑郁情绪),6(无价值感)和9(自杀意念)。第3项(睡眠困难),第4项(疲劳),第5项(食欲变化),第7项(注意力难以集中)和第8项(精神运动激动)加载到躯体上。
虽然斯皮策,et al。[3]标准标准研究在不同人群中得到了多个研究的支持,GAD-7也被发现具有与最初发现的不同的因子结构[10,11]。在美国急性精神病人群(N = 232)中,et al。[10]发现,尽管GAD-7具有良好的内部一致性(Cronbach 's⍺= 0.91),但验证性因子分析未能支持单维度因子结构。样本包括被诊断为社交焦虑障碍(n = 42)、恐慌障碍(n = 27)、强迫症(n = 25)和创伤后应激障碍(n = 19)的患者。Kertz,等。[10]发现,与所有其他项目(0.64 - 0.81)相比,第5项(“焦躁不安,很难安静地坐着”)和第6项(“容易生气或易怒”)对潜在因素的影响仅为中等(分别为0.52和0.53)。只有当第4项(“烦恼放松”)、第5项和第6项可能共同变化时,一维因素结构才被发现很适合。虽然每种焦虑症的样本相对较少,但这表明GAD-7在焦虑症中可能表现不同于GAD。
Beard和Bjorgvinsson[11]在美国的一个部分医院项目(N = 1082)中对接受短暂强化CBT的患者进行了更大规模的研究,发现GAD-7具有与Kertz等人[10]研究中发现的相似的心理测量特性。在1082例患者中,108例(11.7%)最初诊断为惊恐障碍,96例(10.4%)最初诊断为创伤后应激障碍,89例(9.8%)最初诊断为强迫症。GAD-7在整个样本中表现出良好的内部一致性(Cronbach 's⍺= 0.88)。旋转的2因子结构占方差的70%。在2个因素结构中,第一个因素包括项目1(感觉紧张、焦虑或紧张),2(不能停止或控制担忧),3(对不同的事情担心太多)和7(感觉害怕,好像有可怕的事情可能发生)。第二个因素包括其余项目4、5和6。这个两因素结构支持了Kertz的发现,et al。这可能意味着GAD-7测量的一个独立的认知-情感和躯体或行为因素,这也在PHQ-9的研究中得到了强调。
GAD-7在主要的初级保健样本中具有单因素结构。这在精神病学样本和包括一系列焦虑障碍的样本中是不支持的。研究发现了一个双因素结构,它似乎将反映焦虑的认知和情感体验的GAD-7项目(项目1、2、3和7)与反映更多焦虑的身体和行为表现的项目(项目4、5和6)分离开来。
2009年,克伦克et al。[6]为一个被称为PHQ-4的超简短筛选量表提供了证据,该量表基于PHQ-2(“感觉沮丧、抑郁或无望”和“对做事没有兴趣或乐趣”)和GAD-2(感觉、紧张、焦虑或紧张”和“无法停止或控制担忧”)的组合,从每个量表中选取了前两个项目,这两个项目已经被证明有利于筛选。有趣的是约旦对GAD-7的分析,et al。[4]还发现,除了第二和第三个项目对可能例外,第一个项目对几乎优于其他所有项目对,但到目前为止还没有PHQ-9的项目响应理论分析。
这些量表的另一个有趣的领域是症状和项目的可能重叠。显然,抑郁和焦虑之间经常有共病,两者同时发生的概率高达50%[12]。两个量表之间的强相关性既是反映疾病共病的收敛效度的证据,也可能表明项目之间的冗余的可能性。一般来说,心理测量学分析把两个量表分开对待,对项目进行两组分析。将这些项目当作一个量表来分析,看看是否存在冗余,并调查解释所有16个项目所需的因素的数量,这将是有用的。
在目前的研究中,项目反应理论方法,Mokken分析,将采用类似的方式来调查项目和单独的量表,等。[4]调查了GAD-7。莫肯标度是项目反应理论的一种非参数方法,可用于研究量表的维度结构。Mokken缩放与Rasch缩放技术相似,但其优点是在使用时限制较少。尽管基于Guttman缩放,Mokken并没有假设数据是无错误的。它也不包括对项目特征曲线的s型形状的假设,这可能导致许多项目被拒绝,从而降低结果测量的可靠性。验证性因素分析也将用于调查项目的因素结构作为单独的量表和一起。最后,我们将研究各种量表和子量表与功能障碍的简单衡量标准——工作与社会适应量表[14]之间的关系。
参与者
问卷数据来自七千七百六十三名患者(38%男性;62%女性)在英格兰北部的IAPT服务机构注册的学生接受了检查。数据收集于2009年2月至2015年8月之间。
数据分析
计算Cronbach 's alpha和Molenaar Sijtsma (MS)统计量作为信度度量。验证性因素分析(CFA)在R[15]中使用Lavvan包进行。对平均值和方差进行校正的对角加权最小二乘估计被认为是分类数据的最佳估计。采用比较拟合指数(CFI)和近似均方根误差作为拟合的度量。利用R[16]中的Mokken包,使用Mokken分析进一步了解量表的结构。Loevinger系数(H)是莫肯量表分析中最重要的计算方法。Loevinger系数的基础是对项目符合Guttman标准的程度。成对项目的得分应该始终相对于其他项目。也就是说,一个项目比另一个项目更容易或更不容易获得支持,应该在所有参与者中保持一致。项目的“难易程度”是指受访者对某一量表项目的认同程度; more difficult items have lower mean scores. If the easier to endorse item is endorsed less than the more difficult item then this is a Guttman error. In this case for a PHQ-9 item, a higher depression level should lead to a higher score on the item. Loevinger’s H calculates the size of this error for each item, pairs of items and the overall scale. H values of 0.5 indicate a strong scale; weak scales are represented by H values of 0.4 and below. The automated item selection procedure in Mokken was used with the default scalability criterion of H > 0.3 for each item. This procedure is used to maximize the overall H value of the scale.
Mokken分析
16项量表的Cronbach’s alpha值为0.91,MS统计值也为0.91,表明量表具有良好的信度。各项目H值见表1。项目在表中显示的顺序是它们进入量表的顺序。可以看到,GAD-7中的6个项目首先被添加到量表中,第2和第3项(“无法停止担忧”和“担忧太多”)最先出现。PHQ-9中的9个项目被添加到量表中,每个项目的H值都在0.36以上,高于0.3的标准。随着项目被添加到量表,量表的H值从0.79下降到0.43,当所有项目都被包括在内。有趣的是,“变得很容易生气。”GAD-7中的项目是最后一个进入的项目。包含所有16个项目的量表的H值为0.43,这表明这只是一个中等规模的量表(表1)。
表1。GAD7和PHQ9的Mokken分析结果。
迦得7和PHQ 9项一起 |
项目H |
分别是GAD 7和PHQ项目 |
项目H |
GAD7和PHQ项作为四个量表 |
项目H |
无法停止担忧…… |
0.48 |
停止忧虑…… |
0.59 |
停止忧虑……认知/影响 |
0.68 |
担心不同的事情…… |
0.48 |
担心的事情…… |
0.59 |
担心的事情认知/影响…… |
0.65 |
感到紧张焦虑…… |
0.46 |
感到紧张焦虑…… |
0.55 |
感到紧张焦虑……认知/影响 |
0.65 |
麻烦放松…… |
0.48 |
麻烦放松…… |
0.56 |
感觉害怕…可怕的…认知/影响 |
0.55 |
如此焦躁不安…… |
0.42 |
如此焦躁不安…… |
0.49 |
如此焦躁不安……体细胞 |
0.54 |
感觉害怕,好像有什么可怕的东西..... |
0.37 |
感觉害怕…可怕的… |
0.48 |
麻烦放松……体细胞 |
0.54 |
移动或说话缓慢或烦躁..... |
0.42 |
变得容易生气…… |
0.41 |
变得容易生气……体细胞 |
|
很难集中注意力.... |
0.45 |
情绪低落、抑郁 |
0.54 |
情绪低落、抑郁……认知/影响 |
0.65 |
情绪低落、沮丧或绝望 |
0.49 |
没有兴趣或乐趣 |
0.53 |
缺乏兴趣或乐趣........认知/影响 |
0.58 |
对做.....没什么兴趣或乐趣 |
0.46 |
自我感觉不好。 |
0.47 |
自我感觉不好......认知/影响 |
0.58 |
自我感觉不好..... |
0.44 |
这些想法死了还好 |
0.43 |
“死了更好”的想法……认知/影响 |
0.56 |
想法,最好死了..... |
0.39 |
麻烦集中…… |
0.48 |
感觉累了……体细胞 |
0.48 |
感觉累了…… |
0.41 |
感觉累了…… |
0.48 |
难以入睡或保持睡眠状态 |
0.47 |
难以入睡或保持睡眠状态…… |
0.39 |
难以入睡或保持睡眠状态…… |
0.45 |
食欲差或暴饮暴食 |
0.44 |
食欲差或暴饮暴食 |
0.38 |
食欲差或暴饮暴食 |
0.44 |
麻烦集中…体细胞 |
0.46 |
容易发怒的容易生气或暴躁的 |
0.37 |
缓慢的:缓慢地或说话的 |
0.41 |
动作或说话缓慢或身体不稳 |
0.47 |
|
|
|
|
|
|
规模 |
0.43 |
规模(迦得7;PHQ 9) |
0.52;0.47 |
规模(迦得/齿轮;迦得/体细胞;PHQ /齿轮;PHQ /体 |
0.62, 0.50 0.59, 0.46 |
然后分别考虑这些量表。对于GAD-7来说,进入顺序与“变得容易恼怒”相同。结果的模式(r年代= 0.87)与约旦发现的相似,et al。[4],并支持他们的论点,即在GAD7的两项版本中使用第2项和第3项作为第1项和第2项的替代方案是可能的。这次量表的H值为0.52,表明量表强度较大。Cronbach 's alpha为0.86,MS为0.87也是可以接受的值。
当单独分析PHQ9时,条目进入量表的顺序并不奇怪。在这里,“情绪低落,抑郁或绝望”和“做事没有兴趣或乐趣”是前两项,这是克伦克,等。PHQ4建议使用[6]。量表总体H值较低,为0.47,属于中等。总体而言,Mokken分析在这一阶段的结果表明,最好将GAD-7和PHQ-9视为两个测量相关但不同结构的量表。
Mokken分析还对PHQ-9和GAD-7建议的四个可能的子量表进行了分析。在这两种情况下,这可以被视为躯体/行为和认知/情感。认知PHQ-9量表由四个项目组成,具有良好的信度统计,Cronbach 's alpha为0.8,MS为0.81。“认为自己死了会更好”这四个项目的H值最低,为0.56。总体子量表的H值为0.59,这将使它成为一个强量表。躯体PHQ-9亚量表的五个项目Cronbach’s alpha值为0.77,MS值为0.78。所有被提议的项目都以最低的H值0.43进入量表“移动或说话如此缓慢……”。总体亚量表H值为0.46,属于中等量表。
认知GAD-7亚量表由四个项目组成,Cronbach’s alpha值为0.84,MS值为0.85。所有的项目都进入了量表,最低的H项目值为0.55,是“感觉害怕,好像有什么可怕的事情”。总体亚量表H值为0.62,表明量表强度很强。体细胞GAD-7亚量表Cronbach 's alpha为0.72,MS为O.72。“变得容易生气……”这三个项目的H值最低,为0.42。总体子量表的H值为0.503,这将是一个强量表。
验证性因素分析
验证性因素分析结果见表2。考虑到之前的结果和Mokken的分析,单因素解决方案对GAD-7和PHQ-9的16个项目的组合并不合适,这并不奇怪。分别考虑时,GAD-7和PHQ-9都表现出对单因素模型的合理拟合,但两者都明显更好地表现为认知/情感和躯体两因素模型(ΔΧ2= 833,p<措施;ΔΧ2= 660,p<措施)。一个有四个因子代表每个分量表的模型很好地拟合了RMSEA为0.06和CFA为0.99的数据,这再次明显优于单因子模型(ΔΧ2(6) = 9240,p<措施)。总体而言,CFA支持Mokken分析的结果,表明虽然每个量表的一个因素解决方案是合理的,但两个因素提供了更好的拟合和量表统计(表2)。
表2。对GAD7和PHQ9模型进行拟合统计。
模型 |
X2 / Df |
RMSEA和90%可信区间 |
CFI |
一因子16项 |
12263/104 |
0.123 0.121 -0.125 |
0.965 |
一个因素GAD7 |
1172/14 |
0.103 0.098 -0.108 |
0.992 |
两个因素GAD7 |
239/13 |
0.047 0.042 -0.053 |
0.998 |
一个因素PHQ9 |
1479/27 |
0.083 0.080 -0.087 |
0.986 |
两个因素PHQ9 |
819/26 |
0.063 0.059 -0.066 |
0.993 |
四个因素 |
3023/98 |
0.062 0.060 -0.064 |
0.992 |
工作与社会适应量表(WSAS)的关系
WSAS的Cronbach 's alpha和MS为0.79。GAD-7和PHQ-9各量表和子量表之间的相关性如表3所示。PHQ-9和GAD-7的所有量表和亚量表均与WSAS显著相关。PHQ-9对WSAS总分的预测效果明显优于GAD-7 (t(7760) = 15.36,p<措施)。有趣的是PHQ-4 (t(7760) = 11.96,p< .001),以及由PHQ9的前两项组成的PHQ-2,也是显著的(r= 0.50;t(7760) = 6.54,p< 0.01))与WSAS评分的相关性高于GAD7(表3)。
表3。GAD7、PHQ9与WSAS的相关性。
规模 |
GAD7 |
GADCog |
GADSom |
PHQ9 |
PHQCog |
PHQSom |
PHQ4 |
WSAS |
GAD + PHQ(16项) |
0.89 |
0.81 |
0.81 |
0.93 |
0.83 |
0.87 |
0.90 |
0.56 |
GAD7 |
|
0.93 |
0.88 |
0.65 |
0.58 |
0.61 |
0.82 |
0.44 |
迦得的认知 |
|
|
0.64 |
0.57 |
0.54 |
0.51 |
0.82 |
0.38 |
迦得体细胞 |
|
|
|
0.62 |
0.52 |
0.61 |
0.64 |
0.43 |
PHQ9 |
|
|
|
|
0.89 |
0.93 |
0.81 |
0.56 |
PHQ认知 |
|
|
|
|
|
0.68 |
0.83 |
0.52 |
PHQ体细胞 |
|
|
|
|
|
|
0.68 |
0.51 |
PHQ4 |
|
|
|
|
|
|
|
0.51 |
结果表明,虽然GAD-7和PHQ-9的项目可以视为一个量表;从Mokken的角度来看,这将是一个弱量表,而且从更传统的经典测试理论的立场来看,也不适合。有更有力的证据表明,它们应该被视为两个独立的量表,来自Mokken和验证性因素分析。然而,应该注意的是,从Mokken的角度来看,PHQ-9不如GAD-7强大。也有很好的证据表明,在两个量表中,有可能找到两个子量表,这四个子量表中的三个将被视为强量表。我们对GAD-7的Mokken分析结果显示与约旦的相似,et al。[4],但我们通过检查子量表的可能性进一步进行了分析。应当指出,在使用直接的项目选择程序时,不出现分表。
各分量表均与WSAS显著正相关。相关性强度有显著差异,其中PHQ-9的相关性显著更高。也许更重要的是,PHQ-9和PHQ-2,与WSAS的相关性明显高于GAD-7。总之,结果表明,PHQ-9和GAD-7都可以作为两个独立的量表可靠地使用,但在识别它们可能的认知/情感和躯体亚量表时也可能有一些用途。亚量表的信息可能被证明对临床有用。例如,Elhai,et al。[17]发现,在加拿大退伍军人中,抑郁测量的躯体项目比认知-情感项目与创伤后应激障碍(PTSD)因素的相关性显著更高。
2021年版权燕麦。所有权利reserv- Löwe B, Spitzer RL, Williams JB, Mussell M, Schellberg D,等(2008)初级保健中的抑郁、焦虑和躯体化:综合征重叠和功能损害。创Hosp精神病学30: 191 - 199。Crossref]
- Olfson M, Shea S, Feder A, Fuentes M, Nomura Y,等(2000)焦虑、抑郁和药物使用障碍在城市全科医院的患病率。拱Fam地中海9: 876 - 883。(Crossref)
- Spitzer RL, Kroenke K, Williams JBW, Lowe B(2006)评估广泛性焦虑障碍的简单方法:GAD-7。地中海拱形实习生166: 1092 - 1097。
- Jordan P, Shedden-Mora MC, Löwe B(2017)利用现代项目反应理论对初级保健中广泛性焦虑障碍量表(GAD-7)进行心理测量分析。《公共科学图书馆•综合》12: 0182162。(Crossref)
- 克伦克K,斯皮策RL,威廉姆斯JBW (2001) PHQ-9:简单抑郁严重程度测量的有效性。J Gen实习医生16: 606 - 613。
- Kroenke K, Spitzer RL, Williams JB, Löwe B(2009)焦虑和抑郁的超简筛选量表:PHQ-4。心身医学: 613 - 621。(Crossref)
- Ryan TA, Bailey A, Fearon P, King J(2013)患者健康问卷和广泛性焦虑障碍问卷的析因不变性。临床精神科52: 438 - 449。
- Beard C, Hsu KJ, Rifkin LS, Busch AB, Björgvinsson T(2016)精神病学样本中PHQ-9的验证。J影响Disord193: 267 - 273。(Crossref)
- Elhai JD, Contractor AA, Tamburrino M, Fine TH, Prescott MR, et al.(2012)主要抑郁症状的因素结构:使用患者健康问卷-9对四种竞争性模型的检验。精神病学研究199: 169 - 173。
- Kertz S, Bigda-Peyton J, Bjorgvinsson T(2013)广泛性焦虑障碍-7量表在急性精神病人群中的效度。中国Psychol Psychother20: 456 - 464。
- Beard C, Bjorgvinsson T(2014)广泛性焦虑障碍之外:异质性精神病学样本中GAD-7的心理测量特性。J焦虑Disord28日:547 - 552。
- Toft T, Fink P, Oernboel E, Kristensen K, Frostholm L,等(2005)初级保健中的精神障碍;各种疾病的患病率和共发病率。Psychol地中海67: 596 - 601。
- Mokken RJ(1971)量表分析的理论和程序。德格鲁伊特,纽约。
- Marks I(1986)《工作与社会适应量表》。精神病学研究所,伦敦。
- Rosseel Y (2012) lavvan:结构方程建模的R包。统计软件杂志48: 1-36。
- Van der Ark LA (2007) R。统计软件杂志20: -。
- Elhai JD, Contractor AA, Palmieri PA, Forbes D, Richardson JD(2011)在国家创伤暴露的军队样本中探索创伤后应激障碍和抑郁之间的潜在维度的关系。J影响Disord133: 477 - 480。(Crossref)