文本

看看最近的文章

使用新型血浆基蛋白生物标志物测定法对不确定肺结节的风险评估

Neil N. Trivei.

旧金山退伍军人医疗中心,4150克莱门特圣,旧金山,CA,USA

人士Arjomandi

旧金山退伍军人医疗中心,4150克莱门特圣,旧金山,CA,USA

詹姆斯·k·布朗

旧金山退伍军人医疗中心,4150克莱门特圣,旧金山,CA,USA

苔丝鲁宾斯坦

旧金山退伍军人医疗中心,4150克莱门特圣,旧金山,CA,USA

Abigail D. Rostykus.

旧金山退伍军人医疗中心,4150克莱门特圣,旧金山,CA,USA

Stephanie Esposito.

美国费城宾夕法尼亚大学

伊甸园斧头

密歇根大学,500 S State St, Ann Arbor, MI, USA

迈克begg

美国加州米尔皮塔斯MagArray公司

恒玉

美国加州米尔皮塔斯MagArray公司

Luis Carbonell

美国加州米尔皮塔斯MagArray公司

爱丽丝壮

美国加州米尔皮塔斯MagArray公司

桑迪卡默尔

美国加州米尔皮塔斯MagArray公司

Bhavin Patel.

美国加州米尔皮塔斯MagArray公司

山王

美国加州米尔皮塔斯MagArray公司

阿曼达·l·鱼

美国加州米尔皮塔斯MagArray公司

哈达德扎

温哥华,卑诗省,加拿大

艾伦到了吴

加州大学旧金山分校,美国

DOI: 10.15761 / BRCP.1000173

文章
条信息
作者信息
数字和数据

摘要

背景:肺癌筛查的增加加剧了非侵入性试验的需要,以表征发现许多不确定的肺结核(IPN)。需要正确鉴定非癌细胞,以减少过度诊断和过度处理。或者,早期鉴定恶性结节可以代表潜在可固化的肺癌形式。

客观的:开发和验证一种基于血浆的多路蛋白分析方法,通过区分病理上确诊的肺癌患者和临床和影像学上至少稳定一年的患者,对IPN进行分类。

方法:使用一项新技术,我们开发了与肺癌相关的血浆蛋白的检测,并将其纳入一个小组,以确定在胸部成像中发现的IPN是恶性的风险。该检测小组对277个样本进行了评估,所有样本均来自IPN 4-30毫米的当前吸烟者。受试者被分为训练集和测试集,以识别支持向量机(SVM)模型进行风险分类,该模型包含那些为退伍军人事务(VA)临床因素模型添加歧视性信息的蛋白质和临床因素。然后在独立验证队列中评估该算法。

结果:间的97验证研究受试者,68进行分组通过(N = 16)的VA模型,该模型的SVM模型这些中度风险样品的正确识别44(65%),低或高风险(N = 28具有中间风险)。SVM模型负预测值(NPV)为94%,其敏感性为94%。

结论:新型血浆蛋白生物标记物分析的性能支持其作为一种非侵入性风险评估辅助物来表征IPN。支持向量机模型的高净现值表明,它的应用是一个排除测试,以增加提供者的信心,以避免积极干预他们的病人,对他们的VA模型的结果是一个不确定的,中间风险。

关键字

生物标志物;诊断;肺癌;肺结核;风险模型

介绍

肺癌是第三大常见癌症,癌症死亡在美国[1]的主要原因。肺癌最重要的危险因素是吸烟,这导致美国所有肺癌病例[2]约为85%。虽然吸烟率有所减少,大约每6名美国成年人的1是一个当前吸烟者[3]。随着年龄的肺癌的发病率增加和人员最常发生55岁或更旧[4]。

肺癌预后差,和疾病的近90%的肺癌患者的人的死亡。然而,当在早期阶段检测到,非小细胞肺癌(NSCLC)具有太大的更好的预后,并且可以与手术切除[4]被成功治疗。

国家肺癌筛查试验表明,低剂量计算断层扫描(CT)筛选导致高风险个体的相对死亡率增加了20%[5]。然而,死亡率降低伴随着高速率(〜96%)的假阳性CT调节,这反过来为过度使用侵袭性诊断程序[6]产生了关注。CT每年鉴定数百万百万不确定的肺结核,即使大多数这些结节是良性的,许多患者也经过不必要的程序。据估计,美国每年进行35万间支气管镜,其中40%的患者鉴定了良性疾病;此外,超过9%的支气管镜检查患者从该程序中经历并发症,包括出血,气胸和死亡[7]。此外,良性疾病发生了102,000型手术,每年患有2,052人可预防的死亡[8]。因此,对于可以区分良性和恶性结节的非侵入性临床试验,存在高的未满足需要[9,10]。

CT的限制已在正确识别恶性肿瘤的实际风险时结节外观和临床因素导致如由VA模式[9]计算肺癌的不确定中间风险的刺激下新颖血浆和组织生物标志物的研究来援助。目前的技术还没有导致诊断测试充分可靠的或方便的应用到临床实践,以便及早发现攻击性肺癌[8,10,11]的。因此,有必要进行新的生物标志物和使能技术,可以在疾病进展的早期状态识别肺癌,同时限制误报的数量。这是特别真实当恶性肿瘤的概率是在中间范围(如计算,例如由VA型号)和肺部结节是不确定通过在肺小,焦点不透明度测量高达至30mm一点不限定有特征强烈提示良性病因[12]。

一组理想的生物标记物将提供一个信号,以识别恶性结节,无论该对象是当前、曾经或从不吸烟。然而,吸烟会引起肺部的显著基因改变,因此,当前吸烟者的细胞生物化学不同于以前的吸烟者,甚至更不同于从不吸烟者[13]。我们的研究重点是目前的吸烟者,他们是最有可能罹患肺癌的高危人群。与以前或从不吸烟的人相比,现在吸烟的人有更一致的生物标志物,因此更有可能找到一组可靠的信息丰富的生物标志物。超过15%(1780万)的美国成年人被确认为目前的吸烟者,在这个高危队列患者中,有相当一部分人将接受非侵入性检测,该检测可以更准确地识别良性和恶性结节。

材料和方法

实验室开发的测试:新型多重血浆蛋白质测定发育

发现癌症患者产生与肿瘤进展相关的可检测蛋白,提示这些生物标志物可能具有诊断和预后价值[10]。最先进的基因组和蛋白质组信息被用于识别生物标志物候选,这些生物标志物可用于开发敏感和特异性的分析,以测量与肺癌存在相关的循环水平的细微变化。在这些发现的基础上,我们初步开发了7种已知与肺癌[11]存在相关的血浆蛋白生物标志物的多重检测面板。我们在早期发现工作中使用这些定制的检测方法,在一组被纳入肺癌PET-CT成像观察研究的受试者中测量生物标志物水平。研究对象来自三个医疗中心:斯坦福大学诊所、加州太平洋医疗中心和帕洛阿尔托退伍军人事务医院,其中包括吸烟者、吸烟者和从不吸烟的人。

随后将三种蛋白质表皮生长因子受体(EGFR),促蛋白活性剂蛋白B(PROFB)和金属蛋白酶酶1(TIMP1)的组织抑制剂鉴定为当前吸烟者的子集中的歧视性良性和恶性结节。然后,我们优化了那些3个蛋白质测定,并开发出一种风险评估算法,我们在来自多个队列的更多样化的当前吸烟者中培训(图1)。

图1模型开发过程图和主题队列队列

该MagArray技术

新型MagArray磁性纳米传感器技术和仪器能够以不需要光学或微流体的多路格式对生物分子进行敏感检测,同时提供多达640个分析物特定传感器[14]的同时实时读数。该技术被用于开发循环蛋白的多重免疫分析测试,只需要20µL的血浆样品来检测pg/mL分析物水平。

包括肺结节特征测试的三种蛋白分析显示了可接受的分析性能,证明了在商业临床实验室用于计算CT扫描[15]上发现的不确定肺结节的恶性概率所必需的敏感性、精密度和重现性。

研究设计

模型开发研究人口

在开发和优化了三种选定的血浆蛋白分析方法后,我们从8个地理位置不同的中心(包括斯坦福大学诊所、加州太平洋医疗中心和帕洛阿尔托退伍军人事务医院)获得了一套更大的回顾性人类血浆样本和相关临床数据。旧金山退伍军人事务医学中心、宾夕法尼亚大学和肺癌生物标本资源网络(南卡罗来纳医科大学、弗吉尼亚大学和圣路易斯华盛顿大学)。这些样本用于我们基于蛋白质生物标志物的算法训练和测试集。

冷冻EDTA血浆样品被运到中心实验室和冷冻保存(-80℃),直到处理用于测试。该处理包括解冻所述样本,然后制备该被再冷冻,以允许所有的测试100μL等分试样,并重新测试具有相同数量的2次冻融循环发生。研究用新鲜采集,在-80与所测量的分析物值没有变化显著[15冷冻℃,和至多4个冻融循环之前证明了4天在2-8℃下分析物稳定性从未冷冻的样品]。

没有受试者得到补偿。所有样品集合完全符合适用的法律,法规和机构政策,为人类受试者提供保护。血浆样品仅用于原始应用中规定的研究目的,并根据所需的中心规定的条件和IRB规定。未提供对患者护理的临床部位的测试结果,并将生物标志物测试的实验室技术人员蒙蔽了对象特征。蛋白质测定开发研究均按照报告诊断准确性标准的标准进行[16]。

训练和测试集中使用的所有样本均来自25-85岁的吸烟者,临床数据记录显示其肺结节直径为4 - 30mm,不确定。训练集包括121个样本(总队列的2/3),随机从诊断为恶性肺结节的受试者和良性疾病的受试者中选择。剩下的59个样本(总队列的1/3)被分配到测试集。疾病患病率在训练集为64%,在测试集为59%。如表1所示,两个队列的结节大小分布和其他临床特征相似。

表格1主题集人口统计数据。诊断P.-值为良、恶性诊断特征差异的意义。

特征

培训集

测试集

独立的验证

受试者人数,正

121.

59.

97

年龄,平均(SD)[范围],年

62.7(9.1)[25-80]

65.9(9.2)[33-85]

60.1(8.4)[42-83]

良性

60.8 (10.8) (25 - 76)

63.6(10.6)[33-85]

57.3(8.1)[42-74]

恶性

63.8(7.9)[46-80]

67.5 (7.8) [51 - 82]

62.8 (7.9) (50 - 83

诊断P值

0.117

0.133

<0.001

性,n(%)

男性

73(60)

42(71)

58(60)

良性

33(45)

19(45)

28(48)

恶性

40(55)

23日(55)

30(52)

诊断P值

0.321

0.513

0.853

女性

48(40)

17(29)

39 (40)

良性

10(21)

5 (29)

20(51)

恶性

38(79)

12 (71)

19 (49)

诊断P值

<0.001

0.04

1

包 - 年,意思(SD)

49 (30)

45(48)

60 (36)

良性

44(37)

48(42)

57(36)

恶性

51 (26)

53 (34)

63(37)

诊断P值

0.349

0.65

0.455

肺结节

尺寸,平均值(SD)[范围],mm

16.2(7.1)[4-30]

16.4 (6.4) [5-28]

16.0(6.0)[4-29]

良性

11.7(5.6)[4-25]

12.9(5.6)[5-26]

14.9 (6.1) [4-28]

恶性

18.7(6.6)[6-30]

18.7(5.8)[8-28]

17.2(5.6)[8-29]

诊断P.-价值

<0.001

<0.001

0.05

位置上叶中,n(%)

64 (53)

38 (64)

55(57)

良性

17(27)

14(37)

27(49)

恶性

47 (73)

24(63)

28 (51)

诊断P值

<0.001

0.04

1

组织学,n(%)

良性结节的诊断

43(36)

24(41)

48 (49)

肉芽肿

3 (7)

0(0)

5 (10)

CT扫描稳定

12 (28)

8 (33)

41 (85)

没有报道

28(65)

16 (67)

2 (4)

恶性结节类型

78 (64)

35(59)

49 (51)

腺癌

18(23)

13(37)

28(57)

鳞状细胞

8 (10)

4(11)

14(29)

非小细胞肺癌

3(4)

1 (3)

3 (6)

其他

0(0)

0(0)

4(8)

没有报道

49 (63)

17 (49)

0(0)

肺癌阶段,n(%)

阶段I&II

68 (87)

29日(83)

48(98)

阶段三和四

7 (9)

5(14)

1 (2)

没有报道

3(4)

1 (3)

0(0)

种族/民族,n (%)

白色的

96(79)

51(86)

91(94)

黑色的

18(15)

5(8)

4(4)

亚洲

4(3)

1 (2)

0(0)

西班牙裔

1 (1)

1 (2)

0(0)

其他

2(2)

0(0)

2(2)

没有报道

0(0)

1 (2)

0(0)

用蛋白质3-Plex测定面板测量对象样品的训练和测试组。从训练子集获得的蛋白质浓度用于开发一种在良性和恶性肺结节患者之间区分的算法(如统计分析部分所述)。最终算法掺入三种血浆蛋白,以及三个临床因素主体年龄,性别和结节直径。

验证研究人群

回顾性等离子体样本和97个病理或扫描的注释临床信息已从范德比尔特大学医疗中心采购。符合条件的参与者包括当前吸烟者,IPN为4至30毫米。从研究中排除了转移性疾病的受试者,或先前诊断肺癌。在97个受试者中,49例被诊断出患有恶性结节,48例患病率为51%。几乎所有(98%)受试者患有肺癌阶段I或II所定义的早期疾病(表2)。

表2用于验证的独立队列中的SVM模型性能。

验证组;患病率:50.5%

SVM模型(单截止:0.50)

VA模型(低截止值:0.05,高截止值:0.65)

模型结果,n

所有

恶性

良性

所有

恶性

良性

全部的

97

49.

48.

97

49.

48.

高风险

78

46.

32.

29.

18.

11.

中间风险

0.

0.

0.

68.

31.

37.

低风险

19.

3.

16.

0.

0.

0.

正确的

62.

46.

16.

18.

18.

0.

公制,%

验证队列

患病率(50.5%)

预料到的

(患病率25.0%)

验证队列

患病率(50.5%)

预料到的

(患病率25.0%)

PPV

59.

31.9

62.1

10.9

净现值

84.2

94.2.

0.

0.

准确性

63.9

18.6

灵敏度

93.9

36.7

特异性

33.3.

0.

D.X屈服

19.6

0.

风险预测产量

100.

29.9

D.X收率是所有样本中小于下限的百分比,即[真阴性+假阴性]/样本总数。风险预测收益率是给出低风险或高风险结果的所有样本的百分比,不包括给出中度风险结果的样本。PPV=阳性预测值,定义为[敏感性X患病率]/[(敏感性X患病率)+(1-特异性)X(1-患病率)]。NPV =阴性预测值定义为[特异性X(1-患病率)]/[(患病率X(1-敏感性)]+(特异性X(1-患病率))]。

算法开发

首先,恶性肿瘤的VA模式预测可能性,计算出每个样本。然后主要目的是确定和验证算法,其根据3个蛋白和3个临床因素的血浆水平的准确度,以预测良性疾病对在当前吸烟者25-85岁具有不确定的结节肺癌(4-到直径为30毫米)。该算法的结果进行比较,以通过采用恶性肺结节的四个独立预测因子的VA模式的计算结果:吸烟状况,年龄,结节大小,以及年以来戒烟。

这些研究完全符合基于组学的预测测试医学委员会(Institute of Medicine Committee on Omics-Based Predictive Tests[17]) 2012年报告的建议。研究结果由独立的生物统计学家进行分析。

变量转换与选择

结节尺寸为碱基10对数转化后1以避免0值,蛋白质生物标志物浓度是天然原木转化的,受试者性别被视为二元变量,并且年龄除以10.蛋白质和临床变量使用a随机森林方法计算基尼杂质测量的平均降低。

算法开发

支持向量机(SVM)学习算法用于将所选择的特征组装到具有SVM线性内核作为起始点的多维分类器模型中。最终选择步骤用于优化使用10倍交叉验证的调谐函数在分类算法上进行的特征,以优化模型成本和伽马参数至2.1和0.5。最终的SVM模型产生0到1之间的分数,表明结节恶性的风险。

SVM模型的性能与之前发布的VA模型进行了比较,VA模型的计算方法为[9]。

统计分析

在R V3.4.4中进行统计学分析,所有测试均使用5%的显着性水平双面。使用随机框架v4.6-12进行特征排名,并模型识别和调整使用的e1071 v1.6-8。使用最优清点V1.1-3开发出最佳切割点。使用ROC曲线(AUC)下的面积进行评估算法的性能,具有PROC V1.10.0 [18],具有CARET V6.0-78的混淆矩阵,以及使用基础R和GGPLOT V2.21的辨别盒。基础R统计数据和Microsoft Excel V2016用于计算群组人口统计摘要,灵敏度,特异性,否定预测值(NPV)和阳性预测值(PPV)。

结果

生物标志物在训练、测试和验证集中的分布

个体生物标志物和临床因素在良恶性结节诊断中的分布及意义见图2。尽管生物标志物ProSB(图2B)和TIMP1(图2C)以及临床因素年龄(图2E)的显著性不同,但变量的范围没有显著差异。结节大小(图2D)在训练集和测试集的良恶性结节之间差异显著,而在验证集中差异较小。

图2。蛋白质生物标志物和临床因素在良性(蓝框)和恶性(红框)疾病受试者之间的分布。(A) EGFR(表皮生长因子受体),(B) ProSB(表面活性剂蛋白B)和(C) TIMP1(金属蛋白酶组织抑制剂1)血浆水平的自然对数,(D)以10为底肺结节直径+1厘米的对数,和(E)受试者年龄。培训队列组由8个医疗中心合并受试者的2/3组成。测试队列由8个医疗中心合并受试者的其余1/3组成。验证队列组为来自范德堡大学医学中心的受试者。一个队列组内的诊断之间的统计学显著差异由p值表示(在对框上方)。不显著(ns)P.- 值≥0.05。

在训练,测试和验证集算法的性能

具体3种蛋白质和机器学习模型3个临床因素的基础上在随机森林的相对重要性的变量选择与训练集分析,如图3.结节大小是最翔实其次TIMP1和ProSB水平。性别,表皮生长因子受体,并受年龄也是信息,而癌症的历史和结节的位置是最翔实和没有包括在简约模型。

图3。基于随机林分析的基于GINI杂质价值的平均值降低,对肺结节恶性恶性的可能性的可变重要性。结节尺寸是肺结节直径+1cm的对数底座10。TIMP1,ProSB(亲表面活性蛋白B),和EGFR(表皮生长因子受体)(金属蛋白酶-1的组织抑制剂)是变换后的血浆水平的自然对数。性别是受试者的性别编码为0 =女性和1 =男性。年龄是主体年龄除以10.癌症HX是受肺癌以外的癌症史的历史。肺部上叶中结节的位置被编码为0 =否,1 =是。

支持向量机训练分析确定了一种算法,该算法在结节分类以及被VA模型分类为处于中间风险范围的IPN的结节重分类中提供了最佳精度。训练集支持向量机模型的ROC曲线形状比VA模型具有更高的特异性和敏感性。在训练集中,支持向量机模型的ROC曲线下面积(AUC)值显著较高(P.= 0.006)0.86(95%CI 0.79-0.93),比VA模型0.77(95%CI 0.68-0.86)(图4)。验证组显示出较低的AUC值两者的VA模型(0.70,0.59至0.80)和那些不显著不同的算法(0.64,0.53至0.76)(P.= 0.2)。

图4。灵敏度对1- specifcity的接受者操作特征(ROC)曲线图的所有截止值从0到1的SVM模型,并在训练队列集合中的VA模式。所述SVM算法的ROC曲线(蓝线)具有曲线的0.86(AUC)下的面积。的VA模型的ROC曲线(红线)具有0.77的AUC。参考无歧视的曲线由灰色对角线的量,AUC为0.50表示。

从训练数据的分析中确定了0.5的分数截止值,以使整体准确性最大化为灵敏度和特异性的权衡,并强调更高的灵敏度作为排除测试。使用单个切割点0.5,随着训练设定患病率为64%,算法NPV为80%,PPV为78%。这与0%的NPV相比(没有受试者的恶性肿瘤概率<0.05的预测试概率<0.05),并且使用公开的中间风险范围切割点为0.05和0.65的VA模型的64%的PPV。

在验证组中,算法和VA模型显示的84%和0%NPV值,分别使用疾病的51%的患病率在验证组。与用于VA模式和0.05 0.65出版风险范围切割点,只有30%的样品的被分配相比与SVM模型100%风险预测的良品率的风险级别(29.9%风险预测的产率)。与0.5截止,则该算法分为三个主题与恶性疾病为落入切点以下,从而导致94%的灵敏度。这三例患者为男性,52-67岁,具有IPN测量8至12毫米。

在典型的群体肺实践中预期的疾病患病率为0.25%[19-21],SVM模型的预测NPV为94%,PPV为32%。

不确定的肺部结节的重分类分层由VA模式与中间风险范围内的预测试概率

在97个验证设定主题中,68,其中VA模型分配的恶性肿瘤的预测概率在0.05至0.65的中间风险范围内。该算法正确地识别为68(65%)的良性或恶性44不确定IPN。更具体地,正确发现28个(41%)恶性结节的受试者是真正的阳性,而16(24%)的良性疾病被适当地鉴定为真正的阴性。由于正确分类的科目(18 + 28 + 16)减去错误鉴定的受试者的总和(11 + 3 + 21),净重新分类指数为29%。二十一项受试者被归类为假阳性。分析显示11是男性,10名是女性,他们的年龄范围从50-74岁。这些患者中只有两个小于10毫米的结节;其余19个受试者的平均IPN为15毫米。

讨论

这项评估是一项重要的临床验证研究,它是一种新型集成蛋白质组学测试的性能特征,包括蛋白质和临床参数,以准确区分当前吸烟者的良性和恶性结节。作为一项大型的、多中心的回顾性研究,这项工作有几个重要的发现。首先,一个“低风险”的结果准确地识别出良性结节患者,作为排除试验。这种方法可以使医生从需要进一步检测的结节管理策略转向需要连续监测的策略。因此,如果纳入目前治疗结节的算法中,这种测试可能会减少当前吸烟者的发病率和可避免的侵入性手术的成本。其次,很少有恶性肿瘤被漏诊,这些患者的临床表现表明,他们的医生很可能会密切关注他们,从而增加了在随后的临床检查中发现肺癌的机会。

在选择评估肺结节患者的治疗策略时,临床医生应该同时考虑结节恶性的可能性和治疗策略[19]的优缺点。连续监测具有非侵袭性的优势,推荐在癌症概率小于5%[19]的情况下进行。然而,属于这一风险类别的样本相对较少。尽管影像学和非手术活检技术的进步,低风险结节的侵袭性取样和良性结节的手术切除在以社区为基础的肺科医生实践中仍然很常见。另一方面,指南建议,在足够健康、能够耐受手术[19]的人群中,如果检测前癌症概率大于65%的结节应立即切除。与此策略相关的危害包括5%的发病率和0.5%[19]的死亡率。

也许最有挑战性组来管理那些具有中等风险结节目前的指导方针定义为5%,恶性肿瘤的预测可能性65%。区分恶性和良性IPN少数表示在早期检测肺癌[22]的最紧迫的临床问题之一。达在美国[22]到/年的$ 28日十亿 - 尽管大多数不确定的肺部结节代表的良性疾病,显著的发病率和成本与他们的管理有关。值得注意的是,与VA模式也没有主题被确定为低风险。不确定的结节落入高,中或低风险的癌症的比例与临床环境变化,但是最大的比例(50-76%)落在赢得中间风险组[22]。结节在用于良性疾病[22]侵入活检的数量最多的这个组帐户。

预测患肺癌的风险是一项艰巨的任务。过度诊断是在筛选检测肺癌[22]的一个严重问题。血浆蛋白生物标志物,如本文所述的测定法中,可以在帮助选择那些患者适当用于串行监控通过进一步增强了定量,这些结节的无创性评估特别重要。当分析只有那些68 IPN最初由VA模式分类为落入中间风险范围,另外的16(24%)内标本良性疾病得到适当确定为真阴性。在0.94 NPV,这可能表明血浆蛋白测定可以帮助减少与良性疾病患者进行评估的危害。在这项研究中,一个额外的28(41%)受试者与恶性结节被正确地发现是真阳性,这可以使得恶性结节的早期诊断。因为在独立验证组样品的98%的阶段I和II肺癌,早期发现不足以阻止其进展时,这些结节可以表示肺癌的潜在固化性形式。在25%的患病率,和94%的灵敏度,诊断率(即,个人落入0.5切点以下的数)该测试的是20%。基于用于患者落入测试切点以下的假定临床决策,这可以是可能的不必要的活检或手术的20%可通过使用测试来避免。

支持向量机模型在验证队列中的性能较低,尽管没有显著低于训练集和测试集。验证队列只有97个样本,即使一个错误的分类也会对AUC产生影响。总的来说,独立验证集的AUC置信区间与训练集的AUC置信区间重叠。

目前的研究有几个局限性,包括需要更全面地评估在其他种族的测试,以及其他条件(如肥胖及其促炎状态,或类固醇使用)可能会如何影响测试性能。这个算法也依赖于一个顺从的病人;那些不坚持随访预约的患者可能会错过癌症诊断。正如美国胸科协会政策声明[23]所述,还需要一项临床效用研究来评估该算法对临床决策的影响。理想情况下,需要进行长期随访,包括使用该试验预防的肺癌死亡率,以验证这是侵袭性肺癌的有效标志物。

结论

与目前的临床实践方法相比,SVM模型改善了良性结节的风险分层。我们假设良性疾病的患者可以通过避免不必要的肺活检和随后的过度处理,从而提高关注质量并降低这些程序造成危害的风险。

承认

我们感谢博士。Peter Mazzone, Catherine Sears, Doug Arenberg, Martin Tammemagi, M Patricia Rivera, Louise Henderson和Bob Keith,感谢他们对我们工作的指导和不断的鼓励,感谢MagArray有才华的工作人员的实验室工作。

披露

MagArray公司,提供的工作报告所有的资金支持。

参考

  1. 癌症统计事实:肺和支气管癌。可从:http://seer.cancer.gov/statfacts/html/lungb.html
  2. 国家综合癌症网络。可从:https://www.nccn.org/
  3. 美国成年人吸烟的现状。可以从:https://www.cdc.gov/tobacco/data_statistics/fact_sheets/adult_data/cig_smoking/index.htm。
  4. Moyer Va,美国。预防性服务任务队伍(2014)筛查肺癌:美国预防性服务工作队推荐陈述。安实习生地中海160: 330 - 338。[crossref]
  5. 国家肺筛查试验研究小组,Aberle DR, Adams AM, Berg CD, Black WC,等(2011)低剂量ct筛查降低肺癌死亡率。n Engl J Med365: 395 - 409。[crossref]
  6. Tanoue,Lt,Tanner NT,Gould Mk,Silvestri Ga(2015)肺癌筛查。am j respir crit care med191:19-33。[crossref]
  7. 维纳RS,古尔德MK,Slatore CG,BG芬克,施瓦茨LM等。(2014),资源利用和一致性准则在肺结节癌症的评价:太多和太少的照顾。JAMA实习生地中海174: 871 - 880。[crossref]
  8. Hanash SM,白金南CS,Kallioniemi O(2011)新出现的分子标志物,血为基础的战略,以检测和监测癌症。Nat Rev Clin Oncol8:142-150。[crossref]
  9. Gould Mk,Ananth L,Barnett PG,退伍军人事务拍乐合作学习组(2007年)退伍军人事务捕捉合作社研究组。临床模型来估算孤零肺结节患者肺癌预测概率。胸部131:383-388。[crossref]
  10. Hanash S,田口A(2011)蛋白质组学在癌症的早期检测中的应用。癌症J.17:423-428。[crossref]
  11. 田口A,波利蒂K,Pitteri S,洛克伍德WW,FACA VM等人。(2011)肺癌签名在基于等离子体的小鼠肿瘤模型中的蛋白质组分析]。癌症细胞20:289-299。[crossref]
  12. Vachani A,Tanner Ne,Aggarwal J,Mathews C,Kearney P等人。(2014年)影响医生决策的因素,用于不确定肺结结核。Ann Am Thorac SoC11: 1586 - 1591。[crossref]
  13. Mao L,Lee Js,Kurie Jm,Fan Yh,Lippman Sm,等。(1997年)当前和前吸烟者肺部的克隆遗传改变。美国国家癌症研究所89:857-862。[crossref]
  14. Lee Jr,Chan CT,Ruderman D,Chuang Hy,加气斯特Rs等。(2017)使用具有血液血液的磁性纳米调传料对抗体对肿瘤细胞的抗体反应的纵向监测。纳米莱特17:6644-6652。[crossref]
  15. Trivedi nn(2018)肺结节表征新型多分析物血浆试验的分析验证。BioMed Res Rev.2:1-10。
  16. Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP, et al.(2003)报道诊断准确性研究的标准声明:解释和阐述。安实习生地中海138:W1-12。[crossref]
  17. 平移组学的演变。可从以下https://www.nap.edu/catalog/13297/evolution-of-translational-omics-lessons-learned-and-the-path-forward
  18. Robin X,Turck N,Hainard A,Tiberti N,Lisacek F等人。(2011)Proc:用于R和S +的开源包,分析和比较ROC曲线。BMC生物信息学12:77。[crossref]
  19. Gould Mk,Donington J,Lynch Wr,Mazzone PJ,Midthun de等。(2013)对肺结核的个体评估:肺癌什么时候?肺癌的诊断和管理,第3届:美国胸部医师循证临床实践指南。胸部143:e93S-E120S。[crossref]
  20. 米勒YE(2008)最小化不期望的由计算机断层摄影检测肺部结节的后果。am j respir crit care med178:891-892。[crossref]
  21. Tanner NT, Aggarwal J, Gould MK, Kearney P, Diette G, et .(2015)社区肺科医师对肺结节的治疗:一项多中心观察研究。胸部148: 1405 - 1414。[crossref]
  22. masson PP, Walker RC(2014)不确定肺结节:患或发展为肺癌的风险?预防癌症(Phila)7:1173-1178。[crossref]
  23. Mazzone Pi,Sears Cr,Arenberg Da,Gaga M,Gould Mk等。(2017)评估分子生物标志物在早期检测肺癌:何时是临床用途的生物标志物?美国官方胸部社会政策声明。am j respir crit care med196:E15-E29。[crossref]

编辑信息

主编辑

Cory J. Xian.
南澳大利亚大学

文章类型

研究文章

出版历史

收稿日期:2018年10月10日
接受日期:2018年10月24
发布日期:2018年10月29日

版权

©2018特里维迪NN。这是在创意公约归因许可的条款下分发的开放式文章,其允许在任何媒体中不受限制地使用,分发和再现,只要原始作者和来源被记入。

引用

Trivedi NN, Arjomandi M, Brown JK, Rubenstein T, Rostykus AD,等(2018)使用一种新型血浆蛋白生物标志物检测方法评估不确定肺结节的风险。Biomed Res Clin Prac 3: DOI: 10.15761/BRCP.1000173

相应的作者

阿曼达·l·鱼

美国加州米尔皮塔斯MagArray公司

电子邮件:bhuvaneswari.bibleraaj@uhsm.nhs.uk

图1模型开发过程图和主题队列队列

图2。蛋白质生物标志物和临床因素在良性(蓝框)和恶性(红框)疾病受试者之间的分布。(A) EGFR(表皮生长因子受体),(B) ProSB(表面活性剂蛋白B)和(C) TIMP1(金属蛋白酶组织抑制剂1)血浆水平的自然对数,(D)以10为底肺结节直径+1厘米的对数,和(E)受试者年龄。培训队列组由8个医疗中心合并受试者的2/3组成。测试队列由8个医疗中心合并受试者的其余1/3组成。验证队列组为来自范德堡大学医学中心的受试者。一个队列组内的诊断之间的统计学显著差异由p值表示(在对框上方)。不显著(ns)P.- 值≥0.05。

图3。基于随机林分析的基于GINI杂质价值的平均值降低,对肺结节恶性恶性的可能性的可变重要性。结节尺寸是肺结节直径+1cm的对数底座10。TIMP1,ProSB(亲表面活性蛋白B),和EGFR(表皮生长因子受体)(金属蛋白酶-1的组织抑制剂)是变换后的血浆水平的自然对数。性别是受试者的性别编码为0 =女性和1 =男性。年龄是主体年龄除以10.癌症HX是受肺癌以外的癌症史的历史。肺部上叶中结节的位置被编码为0 =否,1 =是。

图4。灵敏度对1- specifcity的接受者操作特征(ROC)曲线图的所有截止值从0到1的SVM模型,并在训练队列集合中的VA模式。所述SVM算法的ROC曲线(蓝线)具有曲线的0.86(AUC)下的面积。的VA模型的ROC曲线(红线)具有0.77的AUC。参考无歧视的曲线由灰色对角线的量,AUC为0.50表示。

表格1主题集人口统计数据。诊断P.-值为良、恶性诊断特征差异的意义。

特征

培训集

测试集

独立的验证

受试者人数,正

121.

59.

97

年龄,平均(SD)[范围],年

62.7(9.1)[25-80]

65.9(9.2)[33-85]

60.1(8.4)[42-83]

良性

60.8 (10.8) (25 - 76)

63.6(10.6)[33-85]

57.3(8.1)[42-74]

恶性

63.8(7.9)[46-80]

67.5 (7.8) [51 - 82]

62.8 (7.9) (50 - 83

诊断P值

0.117

0.133

<0.001

性,n(%)

男性

73(60)

42(71)

58(60)

良性

33(45)

19(45)

28(48)

恶性

40(55)

23日(55)

30(52)

诊断P值

0.321

0.513

0.853

女性

48(40)

17(29)

39 (40)

良性

10(21)

5 (29)

20(51)

恶性

38(79)

12 (71)

19 (49)

诊断P值

<0.001

0.04

1

包 - 年,意思(SD)

49 (30)

45(48)

60 (36)

良性

44(37)

48(42)

57(36)

恶性

51 (26)

53 (34)

63(37)

诊断P值

0.349

0.65

0.455

肺结节

尺寸,平均值(SD)[范围],mm

16.2(7.1)[4-30]

16.4 (6.4) [5-28]

16.0(6.0)[4-29]

良性

11.7(5.6)[4-25]

12.9(5.6)[5-26]

14.9 (6.1) [4-28]

恶性

18.7(6.6)[6-30]

18.7(5.8)[8-28]

17.2(5.6)[8-29]

诊断P.-价值

<0.001

<0.001

0.05

位置上叶中,n(%)

64 (53)

38 (64)

55(57)

良性

17(27)

14(37)

27(49)

恶性

47 (73)

24(63)

28 (51)

诊断P值

<0.001

0.04

1

组织学,n(%)

良性结节的诊断

43(36)

24(41)

48 (49)

肉芽肿

3 (7)

0(0)

5 (10)

CT扫描稳定

12 (28)

8 (33)

41 (85)

没有报道

28(65)

16 (67)

2 (4)

恶性结节类型

78 (64)

35(59)

49 (51)

腺癌

18(23)

13(37)

28(57)

鳞状细胞

8 (10)

4(11)

14(29)

非小细胞肺癌

3(4)

1 (3)

3 (6)

其他

0(0)

0(0)

4(8)

没有报道

49 (63)

17 (49)

0(0)

肺癌阶段,n(%)

阶段I&II

68 (87)

29日(83)

48(98)

阶段三和四

7 (9)

5(14)

1 (2)

没有报道

3(4)

1 (3)

0(0)

种族/民族,n (%)

白色的

96(79)

51(86)

91(94)

黑色的

18(15)

5(8)

4(4)

亚洲

4(3)

1 (2)

0(0)

西班牙裔

1 (1)

1 (2)

0(0)

其他

2(2)

0(0)

2(2)

没有报道

0(0)

1 (2)

0(0)

表2用于验证的独立队列中的SVM模型性能。

验证组;患病率:50.5%

SVM模型(单截止:0.50)

VA模型(低截止值:0.05,高截止值:0.65)

模型结果,n

所有

恶性

良性

所有

恶性

良性

全部的

97

49.

48.

97

49.

48.

高风险

78

46.

32.

29.

18.

11.

中间风险

0.

0.

0.

68.

31.

37.

低风险

19.

3.

16.

0.

0.

0.

正确的

62.

46.

16.

18.

18.

0.

公制,%

验证队列

患病率(50.5%)

预料到的

(患病率25.0%)

验证队列

患病率(50.5%)

预料到的

(患病率25.0%)

PPV

59.

31.9

62.1

10.9

净现值

84.2

94.2.

0.

0.

准确性

63.9

18.6

灵敏度

93.9

36.7

特异性

33.3.

0.

D.X屈服

19.6

0.

风险预测产量

100.

29.9

D.X收率是所有样本中小于下限的百分比,即[真阴性+假阴性]/样本总数。风险预测收益率是给出低风险或高风险结果的所有样本的百分比,不包括给出中度风险结果的样本。PPV=阳性预测值,定义为[敏感性X患病率]/[(敏感性X患病率)+(1-特异性)X(1-患病率)]。NPV =阴性预测值定义为[特异性X(1-患病率)]/[(患病率X(1-敏感性)]+(特异性X(1-患病率))]。