“新颖性和影响”:对宫颈上皮内瘤变(CIN I-III)和宫颈癌患者的宫颈样本进行全基因组甲基化分析,发现CIN III和宫颈癌中启动子高甲基化的基因大量存在,而低甲基化的基因数量明显较少。我们的结果支持比以前认为的更多基因的甲基化谱的预后价值。这些可以很容易地在拭子而不是活组织检查中识别,这有助于它们作为预后标志物的临床应用。
宫颈癌是由一种具有粘膜亲和性的致癌人乳头瘤病毒(HPV)亚型引起的。除了已知的病毒癌蛋白对细胞功能的影响外,有证据表明宫颈癌的发生涉及宿主DNA的表观遗传改变。在这项研究中,我们在广泛的基因组尺度上研究了与宫颈癌进展相关的全局启动子甲基化谱。在宫颈癌发生的不同阶段:低级别宫颈上皮内瘤变(CIN I和II)、高级别宫颈上皮内瘤变(CIN III)和浸润性癌以及健康个体的宫颈拭子中,分析了近14,000个基因的甲基化模式。无监督分析(分层聚类)确定了两组:A)健康,CIN I和CIN II;B) CIN III/癌。监督t检验分析显示,与CIN I/CIN II和健康样本相比,CIN III/癌症中有1069个启动子区高甲基化,85个低甲基化(p<0.0001)。总的来说,差异甲基化基因在转录、细胞周期、细胞凋亡和细胞粘附途径中起作用。在高甲基化基因中,132个(12.3%)在匹配的宫颈癌组中下调。反过来,在该组中只有4个(4.7%)低甲基化基因过度表达。 These data suggest that, although significant changes in methylation of a large number of cellular promoters take place during progression to cervical cancer, correlation between methylation and altered gene expression occurs only in a reduced number of genes. Nevertheless, these genes are relevant to cell transformation. Our results support the prognostic value of methylation profiling of a larger number of genes than previously thought.
宫颈癌,宫颈上皮内瘤变(cin),表观遗传学,全基因组dna甲基化,基因表达,人乳头瘤病毒(hpv)
子宫宫颈癌(CC)是全球女性中第三大常见癌症,2012年估计有超过50万新病例[1]。85%以上的病例发生在发展中国家。在哥伦比亚,CC的估计发病率为每10万居民21.5例[1]。宫颈癌的发生始于非侵袭性发育不良病变,发展为宫颈上皮内瘤变(CIN) I至III级,在某些情况下,病变持续发展为浸润性癌[2]。少数高风险的人乳头瘤病毒(hpv),最著名的是HPV16和HPV18,是大多数cc,以及其他肛门生殖器肿瘤和越来越多的头颈部癌症的病因[3]。这些病毒编码的两种蛋白E6和E7具有转化能力,通过灭活RB1和促进TP53降解,从而干扰信号通路和细胞周期控制机制[4]。然而,疾病的自然史表明,只有少数感染高危hpv的女性不能清除感染并发展为CC[5]。决定HPV感染清除或持续的分子机制主要是未知的。因此,到目前为止,还没有可靠的分子标记可以帮助预测低级别病变是否会发展为癌症,还是会退化并被清除。
癌细胞通过一系列并发的遗传和表观遗传变化形成其恶性表型,这些变化共同影响基因转录并促进整体恶性转化[6]。表观遗传机制通过DNA修饰控制转录活性,其中最重要的是CpG胞嘧啶-5甲基化[6]。人类基因组可以被设想为含有随机分布的甲基化CpG二核苷酸(CpG海洋)的巨大DNA序列区域,高密度的短区域,未甲基化的CpG二核苷酸(CpG岛),以及具有保守的组织特异性甲基化的过渡区域(CpG海岸)[7]。CpG岛存在于近一半活跃转录的人类基因的启动子区域。它们在正常细胞中未甲基化,但在癌细胞中经常高甲基化,这是一种典型的与转录抑制相关的表观遗传变化。从功能的角度来看,胞嘧啶上甲基的存在可以通过结合蛋白与甲基胞嘧啶、染色质重塑蛋白和组蛋白去乙酰化酶的结合导致染色质结构的局部改变,所有这些都阻碍了细胞转录机制对启动子序列的识别。此外,可以想象,癌细胞的甲基化模式特征可以在癌变的早期阶段被识别出来,因此甲基化生物标志物可能有助于CC的早期检测和/或预后评估。
使用高性能平台来评估甲基化谱,可以检测大量可能与肿瘤发生过程相关的甲基化基因。目前有几种方法来确定基因组DNA样本的甲基化谱。一般来说,这些方法包括[8]:(i)甲基化敏感限制性内切酶的DNA酶切,亚硫酸氢盐限制性内切分析(COBRA),甲基化特异性PCR (MSP),每个样品至少需要1-10 ug;(ii)基于可与甲基结合的蛋白质或抗体的方法,其缺点是只能并行处理有限数量的样品;(iii)全基因组DNA甲基化分析,如Illumina Infinium平台,通常需要从500ng到1ug的DNA,并允许同时处理更多的样品。
宫颈癌细胞携带一种或多种致癌型HPV新创CpG甲基化发生在病毒和宿主DNA中。研究表明,HPV16和HPV18的DNA在前永生角质形成细胞中几乎完全未甲基化,而在其永生衍生细胞中则严重甲基化[9]。此外,这些研究表明,在从发育不良到浸润性癌症的过程中,HPV DNA中CpG岛的高甲基化增加。另一方面,对宿主基因组甲基化状态的分析表明,在宫颈癌及其脱落细胞中,超过50个基因的启动子区域是高甲基化的[10]。这些基因中至少有15个在CIN2和CIN3中也被研究,并显示出中等甲基化水平。在几项独立研究中,仅对其中的少数基因进行了分析[10],大多数研究使用了MSP、定量MSP (qMSP)、亚硫酸酯测序或甲基化敏感限制性酶切分析。既往研究发现宫颈癌中高甲基化最显著的基因为CDH1、MAL、TFP12、DAPK1、RARB和TWIST1[11]。据称,包括最后三个基因在内的一个小组对宫颈癌的早期检测具有很高的敏感性和特异性。然而,一项对51项宫颈癌甲基化研究的荟萃分析显示,不同研究中特定基因的甲基化率存在很大差异[11]。
因此,仍然需要广泛的全基因组甲基化研究,这可能有助于阐明表观遗传修饰在从发育不良病变到宫颈癌的进展中的作用,并发现具有预后价值的甲基化生物标志物。微阵列的使用可以同时评估宫颈癌和CIN中几乎任何基因的甲基化状态,并与正常组织进行比较。在本研究中,我们使用Illumina Human-Methylation27 Infinium BeadChip来比较低、高级别CIN和宫颈癌以及正常宫颈脱落的全基因组DNA甲基化谱。对CIN和癌性脱落的甲基化模式进行的监督t检验分析发现,与数量较少的低甲基化基因相比,大量的高甲基化基因启动子。对这些基因表达数据的进一步分析揭示了甲基化状态和表达水平之间的相关性存在差异。
患者和样本
本研究基于描述性、横断面和观察性分析。所有组织样本均在所有参与研究的患者和健康供体签署知情同意书并获得机构审查委员会批准后获得。根据生物特征参数计算纳入本研究的患者人数。在波哥大市的一家医院(Dinamica-IPS)收集了3个月的宫颈标本。训练有素的医务人员采集宫颈拭子。患者队列包括3例未见宫颈病理征象的妇女,17例宫颈组织病理学确诊的患者,即:CIN 1例4例,CIN 2例4例,CIN 3例,CIN 3例在原地鳞状细胞癌(SCC)和3例浸润性SCC。在收集宫颈拭子之前,这些患者均未接受过治疗。
本研究的宫颈拭子存放在含有0.05%硫柳汞的PBS中。通过苯酚-氯仿萃取从这些样品中分离出DNA,随后用BeadChip微阵列进行亚硫酸盐转化和甲基化分析(见下文),并进行多重HPV基因分型(见下文)。样品的质量控制采用分光光度法测定外径260/230和OD260/280使用Nanodrop1000®,在1.0-3.0范围内,浓度约为1500ng/μL。
亚硫酸氢盐转化基因组DNA
基因组DNA的亚硫酸盐转化使用EZ甲基化试剂盒(Zymo Research, D5002),按照制造商的说明进行。简单地说,用荧光法测定DNA浓度Quant-iT™PicoGreen®1μg DNA与缓冲液混合,37℃孵育15分钟,再与转化试剂混合,放入热循环器中,95℃孵育30秒,50℃孵育60分钟,共16个循环。最后,根据制造商的建议对样品进行转化、脱硫和纯化。
人Infinium Methylation27 Illumina芯片
转化的基因组DNA在Made-Radiumhospitalet Rikshospitalet医学中心/奥斯陆大学微阵列核心设施(挪威微阵列联盟)使用Illumina Infinium BeadChip Methylation27 Human Kit进行分析。BeadChip检测提供了覆盖14,495个人类基因启动子区域的27578个CpG二核苷酸的DNA甲基化定量测量。芯片数据处理和分析使用Illumina试剂并按照制造商的说明进行。首先用0.014N氢氧化钠转化DNA变性,在37℃下中和和扩增20-24小时。将样品在48°C下杂交到BeadChip上16-20小时。孵育后,用缓冲液洗涤头芯片并放置在流体站,最后在Illumina iScan扫描仪上捕获图像。数据采用BeadStudio v3.0软件获取。用Multiexperiment Viewer软件获取热图。
多重HPV基因分型(MPG)
多重BSGP5+/GP6+ PCR-MPG使用先前报道的引物进行[12],基本如所述[13]。用9条正义引物BSGP5+ (200 nM)和3条反义引物5′-生物素化- bsgp6 + (400 nM)扩增病毒L1 ORF约150 bp片段,另外用2条引物MS3/MS10 (300 nM)扩增ß-珠蛋白基因,作为DNA完整性对照。多重Luminex杂交试验可检测27种粘膜hpv基因型:1)高风险(HR)-HPV型:16、18、31、33、35、39、45、51、52、56、58、59、66、68;ii)可能的HR-HPV型:26、53、67、70、73、82;iii)低风险(LR)-HPV型:6、11、30、43、44和69。此外,在每个样品中扩增β-珠蛋白产物。
在27种HPV类型中,每一种类型的5'端都有一个氨基的寡核苷酸探针,使用前面描述的碳二亚胺程序将其偶联到羧基化的珠子上[14]。为每个探针和珠子我们使用250万年25µL的羧酸盐珠0.1 M2 - (N-morpholino) ethanesulfonic酸(MES)、pH值4.5,与N - 200µg (3-dimethylaminopropyl) -N-ethylcarbodiimide (EDC)和400 pmol探针,混合物在黑暗中孕育了下搅拌30分钟,EDC和孵化重复了一次,然后洗了珠子0.5毫升的0.2 g / L的渐变20一旦0.5毫升的1.0 g / L SDS。最后,在4°C的TE溶液中保存。PCR产物10µL,在33µL的杂交溶液(0.15 M四甲基氯化铵(TMAC), 75 mM Tris-HCl, 6 mM EDTA, 1.5 g/L萨可齐,pH 8.0)中,加入2000个头联探针,在96孔板上进行杂交。95℃下孵育10分钟,立即冰置2分钟,41℃下搅拌30分钟,然后将样品转移到滤底(Millipore, Bedford, MA)的洗涤板上,用阻断液(PBS含0.2 g/L Tween-20和2.0 M TMAC)预平衡,在真空洗涤台(Millipore)用阻断液洗涤以消除非杂交DNA。随后,生物素化的PCR产物用streptavidin- r - phycorythrin conjugate (Molecular Probes)在2.0 M TMAC、75 mM Tris-HCl、6 mM EDTA、1.5 g/L sacrsyl、1.0 g/L酪蛋白、pH 8.0中稀释1:1600进行染色,室温振荡培养20分钟。用阻断液洗涤三次后,在Luminex 100读取器(Luminex Corp.)中分析珠子,该读取器使用两个激光器,一个识别珠子内部颜色设置的珠子,另一个量化珠子上的报告荧光。结果以每个样品≥100珠的中位荧光强度(MFI)表示[12,14]。
HPV16和HPV18转录本拷贝数
我们分析了HPV16和HPV18早期基因E7的表达情况。为此,我们使用试剂盒RNeasy FFPE (Qiagen®)从石蜡包埋的活检材料中分离总RNA。DNase I处理后,使用“High Capacity RNA-to-cDNA”试剂盒(Applied Biosystem®)进行反转录,并使用E7和E6/E7转录本的特异性引物进行定量实时PCR (qRT-PCR)分析(补充表1)。使用已知量的HPV-16和HPV-18 DNA进行绝对定量,以产生标准曲线来估计转录本拷贝数。
表1。与CIN I/CIN II患者和健康供者相比,CIN III/宫颈癌患者宫颈拭子中选择的甲基化程度较高的基因(无论其表达状态如何)的数据
CpG ID |
创 |
描述 |
RefSeq |
可以 |
A组 |
B组 |
∆——ß |
褶皱 改变 |
调整 p价值 |
的意思是 |
SD |
的意思是 |
SD |
cg23349790 |
IGSF21 |
免疫球蛋白超家族成员 |
NM_032880.2 |
84966 |
0.10 |
0.08 |
0.70 |
0.19 |
0.59 |
6.72 |
5.60 e-6 |
cg09053680 |
UTF1 |
未分化胚胎细胞转录因子1 |
NM_003577.2 |
8433 |
0.06 |
0.08 |
0.63 |
0.20 |
0.57 |
10.44 |
1.21 e-5 |
cg09516965 |
PTGDR |
前列腺素D2受体 |
NM_000953.2 |
5729 |
0.17 |
0.28 |
0.72 |
0.21 |
0.55 |
4.13 |
2.07的军医 |
cg08185661 |
SYT9 |
synaptotagmin 9 |
NM_175733.2 |
143425 |
0.09 |
0.08 |
0.63 |
0.17 |
0.54 |
7.38 |
5.81 e-6 |
cg04534765 |
GALR1 |
丙氨酸受体1 |
NM_001480.2 |
2587 |
0.10 |
0.08 |
0.64 |
0.19 |
0.54 |
6.49 |
1.38 e-5 |
cg01009664 |
韦 |
促甲状腺激素释放激素 |
NM_007117.1 |
7200 |
0.12 |
0.08 |
0.65 |
0.13 |
0.54 |
5.69 |
1.83 e - |
cg17861230 |
PDE4C |
磷酸二酯酶4摄氏度 |
NM_000923.1 |
5143 |
0.15 |
0.08 |
0.69 |
0.14 |
0.54 |
4.58 |
2.45 e - |
cg21458907 |
由 |
钙依赖性分泌激活剂 |
NM_183393.1 |
8618 |
0.06 |
0.04 |
0.59 |
0.18 |
0.54 |
10.29 |
2.69 e-5 |
cg25437385 |
SLC35F3 |
溶质载体族35个成员F3 |
NM_173508.1 |
148641 |
0.08 |
0.05 |
0.62 |
0.11 |
0.54 |
7.58 |
2.83 e-8 |
cg00489401 |
FLT4 |
FMS相关酪氨酸激酶4 |
NM_182925.1 |
2324 |
0.10 |
0.06 |
0.64 |
0.19 |
0.53 |
6.13 |
1.83 e-5 |
cg18443378 |
WDR17 |
WD重复结构域17 |
NM_181265.2 |
116966 |
0.08 |
0.09 |
0.61 |
0.17 |
0.53 |
7.38 |
5.36 e-6 |
cg11657808 |
RYR2 |
赖诺定受体2 |
NM_001035.1 |
6262 |
0.11 |
0.10 |
0.64 |
0.20 |
0.53 |
5.69 |
2.36 e-5 |
cg08453021 |
ELMO1 |
吞噬和细胞运动 |
NM_014800.8 |
9844 |
0.04 |
0.02 |
0.56 |
0.15 |
0.51 |
12.65 |
6.10 e-6 |
cg08575537 |
促红细胞生成素 |
促红细胞生成素 |
NM_000799.2 |
2056 |
0.16 |
0.10 |
0.67 |
0.16 |
0.51 |
4.29 |
1.67 e-6 |
cg07017374 |
FLT3 |
FMS相关酪氨酸激酶3 |
NM_004119.1 |
2322 |
0.09 |
0.09 |
0.59 |
0.19 |
0.51 |
6.93 |
1.79 e-5 |
cg11438428 |
PTF1A |
胰腺特异性转录因子1a |
NM_178161.1 |
256297 |
0.12 |
0.05 |
0.62 |
0.15 |
0.51 |
5.26 |
4.75 e-6 |
cg26609631 |
GSX1 |
GS同质盒 |
NM_145657.1 |
219409 |
0.12 |
0.10 |
0.62 |
0.15 |
0.50 |
5.30 |
1.10 e-6 |
cg02164046 |
风场 |
生长激素抑制素 |
NM_001048.3 |
6750 |
0.08 |
0.03 |
0.58 |
0.20 |
0.50 |
6.91 |
6.56 e-5 |
cg26128092 |
WRAP73 |
含有WD重复序列,与TP73反义 |
NM_017818.2 |
49856 |
0.09 |
0.05 |
0.58 |
0.17 |
0.50 |
6.77 |
1.32 e-5 |
cg00027083 |
EPB41L3 |
红细胞膜蛋白带4.1样3 |
NM_012307.2 |
23136 |
0.13 |
0.14 |
0.62 |
0.12 |
0.49 |
4.73 |
3.89 e - |
cg13877915 |
ZNF132 |
锌指蛋白132 |
NM_003433.2 |
7691 |
0.05 |
0.07 |
0.54 |
0.20 |
0.49 |
10.02 |
1.52的军医 |
cg22619018 |
CSMD1 |
CUB和Sushi多个域 |
NM_033225.3 |
64478 |
0.11 |
0.09 |
0.60 |
0.24 |
0.49 |
5.53 |
2.99的军医 |
cg22881914 |
NID2 |
nidogen 2 |
NM_007361.2 |
22795 |
0.13 |
0.14 |
0.61 |
0.24 |
0.49 |
4.81 |
2.10的军医 |
cg19831575 |
FGF4 |
成纤维细胞生长因子4 |
NM_002007.1 |
2249 |
0.08 |
0.06 |
0.57 |
0.24 |
0.48 |
6.90 |
3.71的军医 |
cg01805540 |
CACNB2 |
钙电压门控通道辅助亚基β 2 |
NM_201593.1 |
783 |
0.07 |
0.06 |
0.55 |
0.20 |
0.48 |
8.44 |
6.42 e-5 |
cg17371081 |
NELL1 |
神经性EGFL样1 |
NM_006157.2 |
4745 |
0.05 |
0.04 |
0.54 |
0.25 |
0.48 |
10.39 |
4.37的军医 |
cg03544320 |
CRMP1 |
坍缩反应中介蛋白1 |
NM_001313.3 |
1400 |
0.25 |
0.19 |
0.73 |
0.10 |
0.48 |
2.95 |
7.08 e-6 |
cg25302419 |
CTNND2 |
连环蛋白2 |
NM_001332.2 |
1501 |
0.07 |
0.07 |
0.56 |
0.18 |
0.48 |
7.55 |
2.37 e-5 |
cg07533148 |
TRIM58 |
包含58个三部母题 |
NM_015431.2 |
25893 |
0.06 |
0.06 |
0.54 |
0.25 |
0.48 |
8.76 |
5.59的军医 |
cg09551147 |
SORCS3 |
sortilin相关VPS10结构域受体3 |
NM_014978.1 |
22986 |
0.05 |
0.04 |
0.53 |
0.24 |
0.47 |
9.89 |
3.78的军医 |
cg12128017 |
EPHA10 |
EPH受体A10 |
NM_173641.1 |
284656 |
0.08 |
0.05 |
0.55 |
0.18 |
0.47 |
7.15 |
6.94 e-5 |
cg20291049 |
POU3F3 |
POU 3类同调箱 |
NM_006236.1 |
5455 |
0.16 |
0.09 |
0.64 |
0.18 |
0.47 |
3.88 |
1.74 e-5 |
cg19096475 |
CLMP |
CXADR样膜蛋白 |
NM_024769.2 |
79827 |
0.11 |
0.05 |
0.58 |
0.14 |
0.47 |
5.27 |
2.89 e-6 |
cg11389172 |
SLC18A3 |
溶质载体族18个成员A3 |
NM_003055.1 |
6572 |
0.05 |
0.04 |
0.52 |
0.24 |
0.47 |
11.29 |
3.67的军医 |
cg10303487 |
DPYS |
dihydropyrimidinase |
NM_001385.1 |
1807 |
0.09 |
0.07 |
0.56 |
0.20 |
0.47 |
6.31 |
8.38 e-5 |
cg19064258 |
HS3ST2 |
硫酸肝素-氨基葡萄糖3-硫转移酶 |
NM_006043.1 |
9956 |
0.11 |
0.06 |
0.58 |
0.18 |
0.47 |
5.14 |
3.08 e-5 |
cg27403635 |
KCNN2 |
钾钙激活通道亚家族N成员2 |
NM_021614.2 |
3781 |
0.09 |
0.09 |
0.56 |
0.15 |
0.47 |
6.14 |
3.51 e-6 |
cg15747595 |
TSPYL5 |
TSPY喜欢5 |
NM_033512.2 |
85453 |
0.14 |
0.08 |
0.60 |
0.15 |
0.47 |
4.44 |
2.12 e-6 |
cg06722633 |
GRIK3 |
谷氨酸嗜离子受体盐酸盐型亚基3 |
NM_000831.2 |
2899 |
0.12 |
0.10 |
0.59 |
0.21 |
0.47 |
4.80 |
7.96 e-5 |
cg17525406 |
AJAP1 |
粘附连接相关蛋白 |
NM_018836.2 |
55966 |
0.12 |
0.08 |
0.59 |
0.24 |
0.47 |
4.89 |
4.04的军医 |
统计和生物信息学分析
使用MultiExperiment Viewer软件(MeV 4.6)进行统计分析和热图可视化[15],并使用欧几里得距离进行无监督聚类分析以创建热图。本分析表明,在CIN I和CIN II阴性组和CIN III原位癌和浸润性癌组之间存在基因甲基化的转折点。采用Benjamini和Hochberg方法[16]进行调整p-用于多次测试。差异甲基化基因的选择采用t检验p = 0.0001。为了实现自动化功能注释和基因富集分析,我们使用了Database For annotation, Visualization and Integrated Discovery (http://david.niaid.nih.gov/david)[17]。DAVID资源计算特定生物主题/途径相对于分析和注释的基因总数的过度表示。利用REVIGO资源对丰富的GO术语进行汇总,并将其可视化为基于的交互式图p- DAVID得到的数值[18]。
本研究使用的基因表达微阵列分析平台为Affymetrix ug - u133a平台和gene expression Omnibus (GEO)(网址:www.ncbi.nlm.nih.gov/geo),登录号为GSE7803[19]。差异表达基因的选择采用欧几里得距离和p = 0.0001的无监督聚类分析。最后,使用列联表进行了高甲基化和表达下调的相关性。
本研究生成的数据集是可用的,可以从基因表达Omnibus (GEO;www.ncbi.nlm.nih.gov/geo/)登录号GSE41384。
患者选择、HPV检测及基因分型
先前的研究已经确定了癌症特异性DNA甲基化区域,并表明甲基化变异性的增加涉及明确定义的基因组结构域的表观遗传稳定性的丧失[20]。此外,正在开发的算法可以帮助预测浸润性癌症的前驱病变进展[21]。对差异DNA甲基化的研究有望确定一组基因,根据它们的甲基化状态,可以确定与正常宫颈组织相比,宫颈癌及其前体病变中编码蛋白的表达改变。此外,它们在癌症进展过程中甲基化的变化可能具有预后价值。本研究旨在分析在进行组织病理学诊断之前,从CIN、宫颈癌患者和健康供者的宫颈脱落物中纯化的DNA甲基化谱。这些样本的优点是容易获得,不需要侵入性技术来收集。相比之下,基于直接从宫颈发育不良组织中获得的DNA分析的方法需要采集活检样本,这可能会产生局部副作用,如出血,最终可能导致初始病变扩散到底层组织。
本研究中研究的DNA样本是从20名随后被诊断为CIN I (n=3)、CIN II (n=4)、CIN III和癌的捐赠者的宫颈拭子中纯化的在原地(n=6)和浸润性宫颈癌(n=3)。我们的研究还包括3例未检测到宫颈病理的病例(健康供体,n=3),尽管他们的HPV检测呈阳性。研究人群的社会人口学和临床数据与宫颈癌致癌的主要危险因素有关,如年龄、性伴侣数量、怀孕次数和生殖器感染史,总结于补充表2。通过多重PCR基因分型(MPG)分析宫颈拭子中HR型和lr型hpv的存在,MPG是一种高度敏感的技术[13]。结果见补充表3。在参与研究的所有患者和健康供体中都检测到HPV。HPV16和HPV18是最常见的病毒类型(n=19, 95%)。在3例中,这些病毒与低hpv型共存,除HPV16和HPV18外,只有1例与HR-HPV型相关。通过定量RT-PCR估计各E7转录本的拷贝数。在所有健康捐献者和近一半患者的样本中,拷贝数低于50个。 In the rest the copy number ranged from 50-100 (Supplementary table 3).
表2。与CIN I/CIN II和健康供体样本相比,CIN III/宫颈癌中启动子区域甲基化程度较高且表达减少的选定基因的数据。表中显示了40个甲基化程度最高的基因(∆ß-值在0.59 ~ 0.47之间,倍数变化在9.74 ~ 4.06之间)和表达水平最低的基因(倍数变化在-2.18 ~ -2.07之间)与正常宫颈组织相比。
基因 |
描述 |
RefSeq |
Entrez ID |
A组 |
B组 |
∆——ß |
甲基化 褶皱变化 |
表达式 褶皱变化 |
调整 p价值 |
的意思是 |
SD |
的意思是 |
SD |
FLT4 |
fms相关酪氨酸激酶 |
NM_182925.1 |
2324 |
0.10 |
0.06 |
0.64 |
0.19 |
0.53 |
6.13 |
-2.02 |
1.83 e-5 |
EPB41L3 |
红细胞中介。蛋白带4.1L3 |
NM_012307.2 |
23136 |
0.13 |
0.14 |
0.62 |
0.12 |
0.49 |
4.73 |
-2.12 |
3.89 e - |
FGF4 |
成纤维细胞生长因子4 |
NM_002007.1 |
2249 |
0.08 |
0.06 |
0.57 |
0.24 |
0.48 |
6.9 |
-2.02 |
3.71的军医 |
HTR4 |
5-羟色胺受体 |
NM_000870.2 |
3360 |
0.08 |
0.04 |
0.55 |
0.15 |
0.46 |
6.6 |
-2.04 |
2.15 e-5 |
EDN3 |
内皮素3 |
NM_000114.2 |
1908 |
0.08 |
0.06 |
0.52 |
0.20 |
0.44 |
6.79 |
-2.52 |
1.23的军医 |
SLC6A2 |
溶质载体家族6个成员2个 |
NM_001043.2 |
6530 |
0.05 |
0.04 |
0.49 |
0.24 |
0.43 |
9 |
-2.04 |
6.63的军医 |
ZNF134 |
锌指蛋白134 |
NM_003435.2 |
7693 |
0.09 |
0.06 |
0.52 |
0.20 |
0.43 |
5.57 |
-2.07 |
1.76的军医 |
GRM6 |
谷氨酸受体,促代谢6 |
NM_000843.2 |
2916 |
0.12 |
0.06 |
0.54 |
0.23 |
0.42 |
4.6 |
-2.07 |
4.23的军医 |
BCAN |
brevican |
NM_198427.1 |
63827 |
0.10 |
0.03 |
0.51 |
0.23 |
0.41 |
5.23 |
-2.03 |
6.72的军医 |
CDO1 |
半胱氨酸双加氧酶,I型 |
NM_001801.2 |
1036 |
0.05 |
0.05 |
0.45 |
0.21 |
0.40 |
8.9 |
-2.04 |
5.22的军医 |
ZNF671 |
锌指蛋白671 |
NM_024833.1 |
79891 |
0.06 |
0.06 |
0.46 |
0.26 |
0.40 |
7.38 |
-2.05 |
0.001 |
PENK |
脑啡肽原 |
NM_006211.2 |
5179 |
0.04 |
0.03 |
0.43 |
0.21 |
0.39 |
9.74 |
-2.18 |
6.68的军医 |
EPHA5 |
EPH受体A5 |
NM_182472.1 |
2044 |
0.10 |
0.06 |
0.49 |
0.19 |
0.39 |
4.7 |
-2.04 |
2.35的军医 |
SLC27A6 |
溶质载体族27 |
NM_014031.3 |
28965 |
0.08 |
0.05 |
0.46 |
0.24 |
0.38 |
5.95 |
-2.11 |
0.001 |
COL6A2 |
ii型胶原蛋白 |
NM_001849.2 |
1292 |
0.04 |
0.03 |
0.42 |
0.25 |
0.37 |
9.66 |
-2.02 |
0.002 |
AK5 |
腺苷酸激酶 |
NM_174858.1 |
26289 |
0.07 |
0.05 |
0.44 |
0.20 |
0.37 |
6.57 |
-2.02 |
5.79的军医 |
PTPRN |
蛋白酪氨酸磷酸酶受体 |
NM_002846.2 |
5798 |
0.07 |
0.06 |
0.43 |
0.23 |
0.37 |
6.49 |
-2.04 |
0.002 |
PHOX2A |
配对同源盒2A |
NM_005169.2 |
401 |
0.07 |
0.06 |
0.42 |
0.23 |
0.36 |
6.27 |
-2.03 |
0.001 |
CDH8 |
钙粘蛋白8,2型 |
NM_001796.2 |
1006 |
0.06 |
0.04 |
0.40 |
0.16 |
0.34 |
6.6 |
-2.05 |
2.63的军医 |
GAS7 |
特定生长阻滞7 |
NM_003644.2 |
8522 |
0.07 |
0.11 |
0.41 |
0.28 |
0.34 |
5.62 |
-2.18 |
0.007 |
SFRP1 |
分泌卷曲相关蛋白 |
NM_003012.3 |
6422 |
0.09 |
0.07 |
0.44 |
0.27 |
0.34 |
4.63 |
-2.09 |
0.005 |
HYDIN |
脑积水诱导同源物 |
NM_017558.2 |
54768 |
0.09 |
0.06 |
0.42 |
0.19 |
0.34 |
4.77 |
-2.02 |
6.49的军医 |
FAM163A |
序列相似的家族163个成员A |
NM_173509.2 |
148753 |
0.04 |
0.04 |
0.37 |
0.29 |
0.33 |
9.15 |
-2.07 |
0.008 |
SYNDIG1 |
突触分化诱导1 |
NM_024893.1 |
79953 |
0.07 |
0.05 |
0.40 |
0.20 |
0.33 |
5.47 |
-2.04 |
0.001 |
CACNA1G |
钙通道电压依赖性1G |
NM_018896.3 |
8913 |
0.05 |
0.05 |
0.37 |
0.21 |
0.32 |
7.23 |
-2.07 |
0.002 |
EDNRB |
内皮素受体B型 |
NT_024524.13 |
1910 |
0.04 |
0.03 |
0.35 |
0.17 |
0.32 |
9.23 |
-2.1 |
5.70的军医 |
CXCL12 |
趋化因子(C-X-C motif)配体 |
NM_199168.2 |
6387 |
0.09 |
0.05 |
0.41 |
0.16 |
0.32 |
4.68 |
-2.4 |
3.14的军医 |
递交 |
视网膜和前神经折叠同质盒 |
NM_013435.1 |
30062 |
0.07 |
0.02 |
0.40 |
0.23 |
0.32 |
5.37 |
-2.04 |
0.003 |
CDX2 |
尾型同形箱2 |
NM_001265.2 |
1045 |
0.06 |
0.03 |
0.37 |
0.14 |
0.30 |
5.89 |
-2.04 |
2.58的军医 |
PRMT8 |
蛋白精氨酸甲基转移酶 |
NM_019854.3 |
56341 |
0.04 |
0.04 |
0.34 |
0.20 |
0.30 |
8.67 |
-2.03 |
0.002 |
DOK5 |
对接蛋白5 |
NM_018431.3 |
55816 |
0.07 |
0.03 |
0.36 |
0.18 |
0.29 |
5.39 |
-2.05 |
0.001 |
PDGFD |
血小板衍生生长因子D |
NM_025208.3 |
80310 |
0.07 |
0.08 |
0.35 |
0.22 |
0.29 |
5.33 |
-2.35 |
0.004 |
ZNF549 |
锌指蛋白549 |
NM_153263.1 |
256051 |
0.05 |
0.05 |
0.34 |
0.19 |
0.29 |
6.7 |
-2.03 |
0.002 |
GABRA2 |
氨基丁酸A2 |
NM_000807.1 |
2555 |
0.06 |
0.06 |
0.34 |
0.22 |
0.28 |
5.49 |
-2.03 |
0.006 |
HAND1 |
心脏和神经嵴衍生物表达 |
NM_004821.1 |
9421 |
0.07 |
0.03 |
0.34 |
0.24 |
0.28 |
5.17 |
-2.05 |
0.008 |
STAC |
SH3和富含半胱氨酸的结构域 |
NM_003149.1 |
6769 |
0.05 |
0.03 |
0.32 |
0.17 |
0.27 |
6.75 |
-2.04 |
0.001 |
GRIK1 |
谷氨酸受体嗜离子盐酸盐1 |
NM_000830.3 |
2897 |
0.06 |
0.04 |
0.32 |
0.20 |
0.26 |
5.24 |
-2.03 |
0.005 |
ADRA2A |
肾上腺素能alpha-2A-receptor |
NM_000681.2 |
150 |
0.06 |
0.07 |
0.31 |
0.18 |
0.25 |
4.85 |
-2.1 |
0.003 |
COL14A1 |
XIV α 1型胶原蛋白 |
NM_021110.1 |
7373 |
0.05 |
0.04 |
0.27 |
0.16 |
0.22 |
5.22 |
-2.29 |
0.003 |
MYRIP |
Myosin VIIA与Rab相互作用蛋白。 |
NM_015460.2 |
25924 |
0.03 |
0.03 |
0.21 |
0.11 |
0.18 |
6.76 |
-2.03 |
0.002 |
表3。与CIN I/CIN II患者和健康供者相比,CIN III/宫颈癌患者宫颈拭子中甲基化程度较低的选定基因的数据该表显示了与正常宫颈组织相比,CIN III和宫颈癌中甲基化程度最低的40个基因。
CpG ID |
基因 |
描述 |
RefSeq |
可以 |
A组 |
B组 |
∆——ß |
褶皱 改变 |
调整 p价值 |
的意思是 |
SD |
的意思是 |
SD |
cg00400263 |
FAM217B |
序列相似的家族217成员B |
NM_022106.1 |
63939 |
0.89 |
0.09 |
0.65 |
0.19 |
-0.24 |
0.73 |
0.006 |
cg17647273 |
UPB1 |
beta-ureidopropionase 1 |
NM_016327.2 |
51733 |
0.86 |
0.07 |
0.63 |
0.16 |
-0.24 |
0.73 |
0.002 |
cg21541083 |
STXBP2 |
Syntaxin结合蛋白 |
NM_006949.1 |
6813 |
0.85 |
0.08 |
0.62 |
0.11 |
-0.23 |
0.73 |
2.29 e-04 |
cg09830866 |
FAM173A |
序列相似的家族173成员A |
NM_023933.1 |
65990 |
0.71 |
0.11 |
0.49 |
0.11 |
-0.22 |
0.68 |
3.54 e-04 |
cg25182621 |
CHRD |
chordin |
NM_177978.1 |
8646 |
0.83 |
0.06 |
0.63 |
0.13 |
-0.20 |
0.76 |
0.001 |
cg16869108 |
VHL |
von Hippel-Lindau肿瘤抑制因子 |
NT_022517.17 |
7428 |
0.68 |
0.13 |
0.48 |
0.10 |
-0.20 |
0.71 |
0.002 |
cg08124030 |
TM4SF1 |
跨膜4 L 6家族成员1 |
NM_014220.2 |
4071 |
0.71 |
0.13 |
0.53 |
0.15 |
-0.19 |
0.74 |
0.009 |
cg18623836 |
RRM2 |
核糖核苷酸还原酶调控亚基M2 |
NM_001034.1 |
6241 |
0.64 |
0.13 |
0.47 |
0.08 |
-0.18 |
0.73 |
0.003 |
cg18149919 |
PUF60 |
聚(U)结合剪接因子60 |
NM_014281.3 |
22827 |
0.83 |
0.06 |
0.65 |
0.09 |
-0.17 |
0.79 |
4.04 e-04 |
cg13625403 |
TRIM29 |
包含29个三元基序 |
NM_058193.1 |
23650 |
0.85 |
0.10 |
0.68 |
0.12 |
-0.17 |
0.80 |
0.004 |
cg02601403 |
TBC1D3C |
TBC1域家族成员3C |
NM_001001418.2 |
414060 |
0.83 |
0.06 |
0.66 |
0.07 |
-0.17 |
0.80 |
0.007 |
cg02910574 |
CHMP1A |
带电多泡体蛋白1A |
NM_002768.1 |
5119 |
0.80 |
0.11 |
0.64 |
0.10 |
-0.16 |
0.80 |
0.004 |
cg15046693 |
CEBPG |
CCAAT/增强子结合蛋白 |
NM_001806.2 |
1054 |
0.57 |
0.08 |
0.41 |
0.11 |
-0.15 |
0.73 |
0.003 |
cg10305797 |
KRTDAP |
角质细胞分化相关蛋白 |
NM_207392.1 |
388533 |
0.58 |
0.14 |
0.43 |
0.07 |
-0.15 |
0.74 |
0.009 |
cg23667432 |
ALPP |
碱性磷酸酶,胎盘 |
NM_001632.2 |
250 |
0.62 |
0.11 |
0.47 |
0.06 |
-0.15 |
0.76 |
0.002 |
cg24691461 |
CCM2L |
CCM2样支架蛋白 |
NM_080625.2 |
140706 |
0.57 |
0.13 |
0.43 |
0.06 |
-0.14 |
0.75 |
0.009 |
cg26233253 |
SLC35E4 |
溶质载体族35个成员E4 |
NM_001001479.1 |
339665 |
0.69 |
0.10 |
0.55 |
0.09 |
-0.14 |
0.80 |
0.006 |
cg12554573 |
PARP3 |
聚(adp -核糖)聚合酶家族成员 |
NM_001003931.1 |
10039 |
0.59 |
0.09 |
0.46 |
0.09 |
-0.13 |
0.77 |
0.004 |
cg19946699 |
SH3BGR |
SH3结构域结合谷氨酸丰富蛋白 |
NM_007341.2 |
6450 |
0.53 |
0.10 |
0.40 |
0.07 |
-0.13 |
0.75 |
0.003 |
cg21372914 |
CLEC4M |
c型凝集素结构域家族4成员M |
NM_014257.3 |
10332 |
0.79 |
0.04 |
0.66 |
0.11 |
-0.13 |
0.83 |
0.006 |
cg02089348 |
TMEM129 |
跨膜蛋白129 |
NM_138385.2 |
92305 |
0.45 |
0.06 |
0.33 |
0.10 |
-0.13 |
0.72 |
0.005 |
cg09547190 |
CARD19 |
Caspase募集结构域家族成员 |
NM_032310.2 |
84270 |
0.52 |
0.08 |
0.39 |
0.06 |
-0.13 |
0.76 |
0.001 |
cg14757296 |
HYAL1 |
hyaluronoglucosaminidase 1 |
NM_007312.3 |
3373 |
0.89 |
0.03 |
0.76 |
0.10 |
-0.12 |
0.86 |
0.007 |
cg17839611 |
GNGT2 |
G蛋白亚基γ转导蛋白 |
NM_031498.1 |
2793 |
0.71 |
0.10 |
0.59 |
0.05 |
-0.12 |
0.83 |
0.003 |
cg13888886 |
SPO11 |
SPO11,减数分裂双链断裂的启动者 |
NM_012444.2 |
23626 |
0.89 |
0.04 |
0.77 |
0.09 |
-0.12 |
0.86 |
0.004 |
cg03309967 |
PSENEN |
早老素增强剂-分泌酶亚基 |
NM_172341.1 |
55851 |
0.71 |
0.07 |
0.59 |
0.09 |
-0.12 |
0.83 |
0.005 |
cg26065841 |
CHAC1 |
谷胱甘肽特异性γ -谷氨酰环转移酶 |
NM_024111.2 |
79094 |
0.84 |
0.04 |
0.72 |
0.08 |
-0.12 |
0.86 |
0.002 |
cg15952487 |
CD1B |
CD1b分子 |
NM_001764.1 |
910 |
0.52 |
0.09 |
0.41 |
0.07 |
-0.12 |
0.78 |
0.006 |
cg25076881 |
OR10J1 |
嗅觉受体家族10亚家族J成员1 |
NM_012351.1 |
26476 |
0.46 |
0.11 |
0.34 |
0.05 |
-0.12 |
0.75 |
0.009 |
cg11536940 |
CPQ |
羧肽酶问 |
NM_016134.2 |
10404 |
0.24 |
0.09 |
0.13 |
0.05 |
-0.11 |
0.53 |
0.004 |
cg23228178 |
PADI4 |
肽基精氨酸脱亚胺酶 |
NM_012387.1 |
23569 |
0.53 |
0.08 |
0.42 |
0.07 |
-0.11 |
0.79 |
0.004 |
cg00136477 |
C1QC |
补c1qc链 |
NM_172369.2 |
714 |
0.70 |
0.07 |
0.59 |
0.07 |
-0.11 |
0.84 |
0.002 |
cg17676574 |
UROC1 |
尿毒酸水合酶 |
NM_144639.1 |
131669 |
0.77 |
0.07 |
0.66 |
0.06 |
-0.11 |
0.86 |
0.001 |
cg00750606 |
CDA |
胞嘧啶核苷脱氨酶 |
NM_001785.1 |
978 |
0.67 |
0.05 |
0.56 |
0.05 |
-0.11 |
0.84 |
3.46 e-04 |
cg24387380 |
GABRA5 |
-氨基丁酸A型受体α 5亚基 |
NM_000810.2 |
2558 |
0.58 |
0.10 |
0.47 |
0.06 |
-0.11 |
0.81 |
0.009 |
cg01618851 |
CD209 |
CD209分子 |
NM_021155.2 |
30835 |
0.54 |
0.07 |
0.43 |
0.06 |
-0.11 |
0.80 |
0.003 |
cg11299964 |
MAPKAP1 |
丝裂原活化蛋白激酶相关蛋白1 |
NM_001006620.1 |
79109 |
0.27 |
0.09 |
0.17 |
0.05 |
-0.11 |
0.61 |
0.006 |
cg06256735 |
MFAP5 |
微纤维相关蛋白 |
NM_003480.2 |
8076 |
0.71 |
0.08 |
0.61 |
0.06 |
-0.11 |
0.85 |
0.006 |
cg23988567 |
IGHG3 |
免疫球蛋白重常数γ - 3 |
NT_026437.13 |
3502 |
0.82 |
0.03 |
0.71 |
0.09 |
-0.11 |
0.87 |
0.009 |
cg26799474 |
CASP8 |
半胱天冬酶8 |
NM_001228.3 |
841 |
0.32 |
0.09 |
0.21 |
0.06 |
-0.10 |
0.67 |
0.007 |
全基因组启动子甲基化分析
启动子序列的甲基化变化通常与异常的转录活性有关。大约一半已知的人类基因启动子含有CpG岛[22],它们受到保护新创正常组织中的甲基化,但通常在癌细胞中获得甲基化,最终导致基因沉默。为了了解宫颈癌进展过程中甲基化的全局变化及其对转录的影响,我们对14495个基因的启动子区域的27578个CpG二核苷酸进行了全基因组DNA甲基化分析,使用了从宫颈发育不良(CIN I-CIN III)、宫颈癌患者和健康供体的宫颈拭子中提取的总DNA。生成的数据集可以从Gene Expression Omnibus(登录号GSE41384)检索。
为了捕捉数据的内在本质,采用无监督分层聚类方法进行统计分析。我们决定排除一个CIN样本,因为它相对于其他样本表现出明显不同的行为。无监督分析(分层聚类)发现,基于甲基化谱的相似性(以欧几里得距离测量),样本倾向于聚为两组:A组,包括上皮内病变阴性的样本,以及CIN I和CIN II样本;B组,包括CIN III,为癌原位侵入性癌症样本。在第二步中,进行监督t检验分析,以确定在非监督分析中检测到的组之间甲基化水平存在显著差异的基因。该分析表明,在宫颈癌进展过程中,基因启动子内CpG岛的高甲基化明显比低甲基化更频繁(图1A)。因此,B组中1069个基因启动子中的CpG岛被高甲基化,而这一组中低甲基化的基因数量明显较少(85个)(p<0.0001)(图1A和补充表4)。图1A中的热图显示了健康/CIN I/CIN II样本中基因启动子甲基化的差异,与CIN III/宫颈癌样本相比。1069个高甲基化基因按其∆ß-值排列的完整列表见补充表4,以及它们的折叠变化和结果p-用于数据统计分析的学生t检验的值。
表1显示最高的40个基因列表∆ß值第三CIN和宫颈癌(B组)。这些基因的选择标准是:(i)平均基底ß值< 0.2 a组(健康/ CIN i / CIN II样本)和(2)∆ß值> 0.45(计算减去均值ß值在a组与B组)。此列表中的三大基因IGSF21, UTF1和PTGDR∆ß值为0.59,0.57和0.55,分别。该方法还发现了6个甲基化折叠变化> 10的基因:UTF1、CADPS、ELMO1、ZNF132、NELL1和SLC18A3。
为了比较和整合我们研究人群中差异甲基化的基因与之前在宫颈癌样本中描述的基因表达谱,我们选择并分析了一些公开获取的基因表达微阵列[19]。使用的微阵列平台为基因表达Omnibus (GEO, www.ncbi.nlm.nih.gov/geo/)的Affymetrix ug - u133a,登录号为GSE780319。差异表达基因的选择采用欧几里得距离无监督聚类分析。分析使用与甲基化微阵列相同的软件来比较宫颈癌和正常宫颈样本中的基因表达,并采用相同的截止值进行统计显著性(p≤0.0001)。
如图1B和C所示为分析结果,与正常宫颈组织相比,宫颈癌中有1726个基因下调。当这些基因与具有高甲基化启动子的1069个基因相遇时,我们确定了两组共有的132个基因(12.3%)(图1C,补充表5)。图1B中的热图显示了与正常宫颈组织相比,在宫颈癌中表达较低的高甲基化基因的监督层次聚类。表2包含了40个启动子甲基化程度最高的基因(∆ß-值在0.53 ~ 0.18之间,倍数变化范围在9.74 ~ 4.06之间)和表达水平最低的基因(倍数变化范围在-2.18 ~ -2.07之间)与正常宫颈组织相比的数据。该列表中排名前三位的基因分别是:FLT4 (fms相关酪氨酸激酶4)、EPB41L3(红细胞膜蛋白带4.1L3)、FGF4(成纤维细胞生长因子4),∆ß-值分别为0.53、0.49和0.48。
如图1所示,我们的分析还发现了85个低甲基化基因(补充表6)。表3包含了在CIN III和宫颈癌中启动子甲基化程度较低且-∆ß-值最高(-0.24至-0.10)的40个基因的选择数据。有6个-∆ß值在-0.20及以上的基因:功能未知的FAM217B(序列相似家族217成员B)、UPB1 (β -脲基丙酸酶1)、STXBP2 (syntaxin结合蛋白2)、FAM173A、CHRD (chordin)和VHL (von Hippel-Lindau肿瘤抑制因子)。此外,我们的监督t检验分析显示,与正常组织相比,宫颈癌中有1945个基因表达增强。hypermethylated基因相比,应急表显示,只有只有4 85 - hypomethylated基因(4.7%)的基因表达增加宫颈癌:NCAP-G (condensin复杂的亚基),PSENEN (presenilinγ分泌酶亚基),HIST1H3H(集群1组蛋白H3家人H)和RRM2(核苷酸还原酶调节亚基M2),∆ß值为-0.05,-0.12,-0.07和-0.18,分别(表3和补充表6)。
肿瘤性宫颈病变差异甲基化功能基因簇
与低级别病变和正常组织相比,晚期宫颈病变和宫颈癌启动子区域CpG岛的基因本体论分析显示,甲基化谱显著高于低级别病变和正常组织。
我们使用生物信息学工具Database for Annotation, Visualization and Integrated Discovery (DAVID) [17] (URL DAVID .abcc.ncifcrf.gov)进行基于基因本体(Gene Ontology, GO)的基因分析。为了分析热图如图1所示的高甲基化和低甲基化基因,我们使用了DAVID的功能注释工具,该工具提供了与所有注释基因相关的基因列表中丰富的生物功能信息。
图1所示。132个基因亚群甲基化及高甲基化与基因表达相关性的聚类分析。A.来自CIN、原位癌和浸润性癌患者以及健康供体的宫颈样本中基因启动子甲基化的监督分层聚类。差异甲基化基因通过监督t检验分析鉴定,其中只选择p≤0.0001的基因。甲基化值的热图区分了两个宫颈样本子集:左侧为正常和低级别病变(CIN I和CIN II),右侧为CIN III/癌(原位和侵袭性)。颜色的强度表示Δβ-values的梯度,范围从0(亮绿色)到1(亮红色)。结果表明,这些基因的启动子区域是晚期宫颈发育不良和癌症中甲基化异质性增加的位点。B.与正常组织相比,宫颈癌中132个表达下调的高甲基化基因的监督分层聚类热图。纳入GSE7803患者。采用p=0.0001作为截止点的t检验分析。颜色的强度表示从0(亮绿色)到1(亮红色)的表达梯度。 C. Venn Diagram of contingency showing an overlapping group of hypermethylated and down-regulated genes in CIN III and cervical cancer (p<0.0001).
左侧面板如图2所示(A和B)显示的GO-analysis与更高程度的132个基因启动子甲基化在CIN III /宫颈癌无关的基因表达数据,这些基因被选为第一个hypermethylated基因的132个基因列表中由他们安排∆ß值(补充表4)。结果,在应用REVIGO[18],消除冗余的计算,显示更高频率的转录和细胞结构基因(分别为27%和26%),其次是参与神经元活动、信号转导、细胞周期和代谢的基因(分别为14%、12%、8%和8%)。基于氧化石墨烯分析的生物过程交互图如图2b所示。
图2右图(C和D)显示了对CIN III /宫颈癌中132个高甲基化和下调基因的go分析,在使用REVIGO[18]去除了冗余项后,发现参与细胞结构的基因(27.4%)普遍存在,其次是与转录(24.3%)、代谢(10%)、神经元功能(6.8%)、细胞周期调节(5.7%)、发育(4.1%)和其他细胞过程(如调节T细胞活化)相关的基因。离子转运和细胞粘附(图2c和D)。图2c显示了基于本体分析和132个高甲基化和下调基因的基因簇的生物过程交互图。具有较高基因表达的淋巴结与增殖、信号传导、粘附和细胞间通讯有关。
图2。与CIN /CIN和健康供体样本相比,CIN III和宫颈癌中甲基化程度较高的基因的基因本体(GO)富集分析。A和B显示了CIN III和宫颈癌中132个启动子区高甲基化基因的分析。C和D显示与CIN III和宫颈癌中表达减少相关的高甲基化启动子区域基因的分析。A和C:基于分子功能、生物过程和细胞成分的GO术语用Panther生成的分数分布。B和D:根据REVIGO协议绘制的GO术语分析,得出基于本体分析和高甲基化和下调基因的基因簇的生物过程交互图。节点的大小和颜色强度与特定术语相关的基因数量和统计显著性(p分别值)。连接节点的线的厚度与它们相互作用的调节或生化途径的接近程度成正比。
图3显示了85个甲基化程度较低的基因在CIN III /宫颈癌中的GO富集分析。这些基因的分数分布(图3a)显示,与细胞结构相关的基因(22%)和代谢相关的基因(13%)的发生率较高,但与高甲基化基因组相比,参与转录调控的基因(8%)的发生率明显较低。细胞周期和发育基因各占6%。此外,很大一部分基因(34%)参与多种功能,如细胞凋亡、细胞器组织和分泌、离子和糖的运输以及免疫反应的调节。这4个在CIN /宫颈癌中表达增强的低甲基化基因基本参与了基因表达和信号转导的调控。
图3。肝癌和宫颈癌85个低甲基化基因的氧化石墨烯富集分析。A.基于分子功能、生物过程和细胞成分的低甲基化基因GO术语用Panther生成的分数分布。B.按照REVIGO方案绘制的GO术语分析。基于本体分析和低甲基化基因簇的生物过程交互图。节点的大小与特定术语相关的基因数量和统计显著性(p分别值)。连接节点的线的厚度与它们相互作用的调节或生化途径的接近程度成正比。
启动子甲基化状态与基因表达有明显相关性的基因
在我们的研究中,一组有趣的基因被高度甲基化,其表达在宫颈癌中被发现减少,属于钙粘蛋白家族。因此,我们发现了编码细胞粘附蛋白的高甲基化基因,如PCDH11X,CDH22, CDH12和CDH8。先前使用medip芯片分析的甲基化研究表明,PCDH11X的启动子在CIN III中被高甲基化[23]。此外,据报道,与邻近正常组织相比,乳腺癌组织中CDH22的启动子高度甲基化。此外,无论年龄和肿瘤分期如何,CDH22的高甲基化与预后不良相关[24]。我们的研究结果证实了这些数据,并将其扩展到CIN III和宫颈癌中钙粘蛋白CDH12甲基化增加。CDH12是位于染色体5p14.3上靠近FRA5E的一个大基因,FRA5E是一个基因组不稳定区域,属于分布在整个人类基因组中的一组约90个常见脆弱位点(CFS),致癌hpv经常在其中整合[22]。CDH12的高甲基化可能与HPV整合有关,尽管这一事件仍有待在我们的样本中进行测试。与我们的数据一致,最近的一项前瞻性横断面研究显示,启动子高甲基化cadherin 8, 2型(CDH8)和另外两个肿瘤抑制候选基因(腺苷酸环化酶8,ADCY8和锌指蛋白582,ZNP528),通过亚硫酸氢盐-焦磷酸测序的基因组DNA进行量化。这些基因的高甲基化与病情恶化相关[26]。
编码血管活性肽的基因EDN3(内皮素3)在CIN III/癌症样本中被高甲基化。该基因最近被报道在CIN III型病变中出现高甲基化和下调,提示其参与宫颈癌的发病机制[27,28]。有趣的是,在最近的一项研究中,编码内皮素受体B型(EDNRB)的基因在CIN和癌症组织中也出现了高甲基化[29]。
我们还发现了SFRP家族成员在CIN III和宫颈癌中高甲基化,特别是SFRP1(分泌卷曲相关蛋白1),它通过与Wnt家族成员的直接相互作用作为Wnt信号的调节剂。SFRP基因的表观遗传沉默导致与癌症相关的wnt通路的失调控激活。先前在浸润性宫颈癌[30]和宫颈癌来源细胞系[31]中发现了SFRP1的高甲基化和沉默。
的TP73基因是同源的p53基因,参与细胞周期控制以应对DNA损伤,TP73在本研究中,在CIN III和癌症中高甲基化,与宫颈癌中的低表达相关,与先前报道的结果相似[32,33]。
据报道,与CIN /CIN相比,AR(雄激素受体)基因在CIN III/宫颈癌中表达不足[34],在这两组中甲基化程度不同,并且在从CIN到癌症的进展过程中甲基化程度增加。
一些与免疫系统相关的基因,如CXCL12和IL1b,在CIN III和宫颈癌中被高甲基化。最近,CXCL12在宫颈癌活检和已建立的细胞系(HeLa, SiHa)中显示高甲基化,表达下调[35]。
迫切需要识别能够预测宫颈上皮内瘤变向浸润性癌进展的标志物,从而为该疾病的随访和处理决策提供更好的支持,特别是在癌前阶段。与DNA甲基化相关的生物标志物显示出了希望11。DNA甲基化是一种正常的细胞过程,用于沉默基因和调节基因剂量。然而,在从肿瘤起始到转移的癌变过程中,已经观察到DNA甲基化异常,尤其是在基因启动子区域[36]。事实上,不同的甲基化,特别是高甲基化在许多类型的肿瘤中经常被描述为与其起源组织有关[37]。
本研究旨在鉴定晚期前驱上皮内病变或宫颈癌患者样本中基因启动子区域甲基化的差异,并与无宫颈病理证据的健康供体样本进行比较。此外,我们打算确定基因启动子甲基化的变化是否与宫颈癌进展过程中相应编码蛋白的差异表达相关。
版权所有OAT。版权所有
先前评估宫颈癌表观遗传学的研究表明,在正常和宫颈癌组织中,特定基因的启动子区域甲基化存在差异[30]。事实上,异常甲基化已经从宫颈癌发生的早期阶段被描述。除了其机制意义外,肿瘤细胞中差异甲基化的基因可能作为疾病早期检测的生物标志物,并具有预后价值[38]。然而,迄今为止的研究在某种程度上揭示了不确定的结果,在某些情况下,结果相互矛盾[10]。这可以用不同的分析技术、研究人群的种族/遗传变异性、样本中存在的HPV类型的差异以及这些研究中评估的基因多样性来解释[39]。这些基因包括CDH1 (E-cadherin)、DAPK1(死亡相关蛋白激酶1)、CADM1(细胞粘附分子1)、RARB和TERT(端粒酶)。总的来说,这些研究描述了宫颈高度病变(CIN II / CIN III)样本中29 - 33%的甲基化与宫颈癌进展相关,但没有得出宫颈癌进展的可能预测潜力的结论[10]。
然而,很明显,只有对基因组进行广泛的同时分析才能确定与宫颈癌发展相关的差异甲基化基因亚群,这可能具有很高的预后意义。这些研究应提供与宫颈癌进展相关的DNA甲基化模式的新数据,从而增加可作为预后生物标志物的候选基因的数量。在先前的一项分析高级别(CIN III)和健康女性全基因组甲基化模式的研究中,COL25A1和KATNAL2被鉴定为高甲基化,并被建议作为宫颈癌早期检测的候选生物标志物[23]。此外,在最近的一项研究中,法卡斯et al。[38]描述了与CIN3和正常宫颈组织相比,宫颈癌中有24个差异甲基化基因亚群。
在本研究中,我们使用Illumina平台评估宫颈癌发生(CIN至CIN III和宫颈癌)不同阶段患者宫颈拭子基因组的甲基化谱,并将其与健康供体进行比较。应用无监督聚类分析对结果进行了检查,该分析允许确定两种不同的甲基化谱,一种对应于健康供体,CIN I和CIN II (A组),另一种对应于CIN III和宫颈癌(B组)。由于样本数量有限,不可能评估HPV类型(和拷贝数)与两组中单个基因甲基化状态之间的统计显著关系。
高甲基化经常导致基因表达下调。含有甲基cpg结合域或C2H2锌指的DNA结合蛋白与甲基化DNA结合,介导甲基化启动子的转录抑制[40]。因此,我们认为有必要将CIN III组/宫颈癌患者中发现的高甲基化启动子基因与使用微阵列平台(Affymetrix HG-U133A)在可比较的研究人群中进行的基因表达分析中发现的这些基因的表达谱进行比较。在交叉分析中,我们发现,在我们鉴定的1069个高甲基化基因中,Affymetrix HG-U133A基因表达阵列中只有120个基因(约11%)表达下调,而其余高甲基化基因的表达没有变化(图1和表2)。
本研究中发现的高甲基化和下调基因大多数参与细胞转录和转导途径,只有少数参与代谢和细胞粘附。从这些基因的已知功能可以推断,抑制它们会促进致癌过程[41]。对本研究中发现的差异低甲基化基因的分析确定了四个在CC中被发现过表达的基因:HCAP-G、PSEN、HIST1H3H和RRM2。AKR1B10基因、TPX2、HCAP-G和RRM2基因的转录增加在肝细胞癌中已有报道[42]。此外,有研究表明,E7可增加肿瘤组织和宫颈癌细胞系中RRM2的表达[43]。它们被认为是潜在的治疗靶点,因为它们被干扰RNA抑制可以降低肿瘤细胞的增殖在体外。最近发现,与正常宫颈组织相比,局部晚期宫颈癌中PSEN1 (γ -分泌酶复合物的一个亚基)的表达增加[44]。至于组蛋白簇1h3h, HIST1H3H,已知与正常组织相比,它在宫颈鳞癌组织中过表达(Human Protein Atlas)www.proteinatlas.org).此外,最近一项结合转录组学、组织微阵列和分子对接的研究表明,该基因在肾细胞癌中的表达增强[45]。
总之,有一种趋势表明,在CIN III和宫颈癌患者的宫颈拭子样本中甲基化谱相似,而在CIN I、CIN II患者和病理阴性受试者的样本中甲基化谱明显不同。对更多患者的进一步研究应该确定哪些基因在这里被鉴定为差异甲基化具有更大的预后价值。
作者没有利益冲突。
哥伦比亚国立大学科伦西亚分校(编号1101-519-28973)和德国癌症研究中心(DKFZ)
我们感谢那些为这项研究提供样本的妇女。我们感谢Harald zur Hausen教授的持续支持和讨论,以及Victoria Juarez对手稿的批判性阅读。这项工作得到了COLCIENCIAS(110151928973, 519-2010)对AGR和FAA的部分资助。我们感谢那些为这项研究提供样本的妇女。我们感谢Harald zur Hausen教授的持续支持和讨论,以及Victoria Juarez对手稿的批判性阅读。这项工作得到了COLCIENCIAS(110151928973, 519-2010)对AGR和FAA的部分资助。
查看补充数据
- Ferlay J, Shin HR, Bray F, Forman D, Mathers C,等。(2010)2008年全球癌症负担估算:GLOBOCAN 2008。恶性肿瘤127: 2893 - 2917。(Crossref)
- zur Hausen H1(2009)乳头状瘤病毒在人类癌症的病因-一个简短的历史叙述。病毒学384: 260 - 265。(Crossref)
- Muñoz N, Bosch FX, de sanjossess, Herrero R, castellsaguex等(2003)宫颈癌相关人乳头瘤病毒类型的流行病学分类。[英]医学348: 518 - 527。(Crossref)
- Wise-Draper TM, Wells SI(2008)乳头瘤病毒E6和E7蛋白及其细胞靶标。前面Biosci13: 1003 - 1017。(Crossref)
- 刘建军,刘建军,刘建军(2007)人乳头瘤病毒与宫颈癌的关系。《柳叶刀》370: 890 - 907。(Crossref)
- 沈慧,Laird PW(2013)肿瘤基因组与表观基因组的相互作用。细胞153: 38-55。(Crossref)
- Irizarry RA, Ladd-Acosta C, Wen B, Wu Z, Montano C等。(2009)人类结肠癌甲基化组在保守组织特异性CpG岛海岸表现出相似的低甲基化和高甲基化。Nat麝猫41: 178 - 86。[Crossref]
- 樊杰比(2010)全基因组DNA甲基化分析。Wiley跨学科Rev系统生物医学2: 210 - 223。(Crossref)
- (2009)与人类癌症相关的双链DNA病毒的动态DNA甲基化。基因组Res19日:438 - 51。[Crossref]
- Wentzensen N, Sherman ME, Schiffman M, Wang SS .(2009)甲基化标志物在宫颈癌早期检测中的应用:最新的科学评价。Gynecol杂志112: 293 - 9。[Crossref]
- Shivapurkar N, Sherman ME, Stastny V, Echebiri C, Rader JS等。(2007)甲基化标志物在宫颈肿瘤检测中的应用。Gynecol杂志107: 549 - 53。[Crossref]
- Schmitt M, Dondog B, Waterboer T, Pawlita M(2008)利用新型广谱GP5+和GP6+引物同源扩增生殖道人α乳头瘤病毒。临床微生物学杂志46: 1050 - 9。
- Garcia DA, Cid-Arregui A, Schmitt M, Castillo M, Briceno I等。(2011)利用PCR多重检测和Luminex技术在哥伦比亚异常细胞学妇女群体中的高灵敏度检测和基因分型。开放病毒J5: 70 - 9。[Crossref]
- 李建军,李建军,李建军,等。(2006)人乳头瘤病毒基因分型的研究进展。临床微生物学杂志44: 504 - 512。(Crossref)
- 朱文涛,Gottardo R, Raftery AE, Bumgarner RE, Yeung KY (2008) MeV+R:使用MeV作为微阵列分析中生物导体应用的图形用户界面。基因组医学杂志9: R118。(Crossref)
- 陈建军,陈建军,陈建军,陈建军(2001)行为遗传学研究中的错误发现率控制。行为与大脑125: 279 - 284。(Crossref)
- 黄大伟,谢尔曼BT, Lempicki RA(2009)基于DAVID生物信息学资源的大基因列表系统整合分析。Nat Protoc4: 44-57。[Crossref]
- Supek F, BoÅ ' njak M, Å kunca N, Å muc T (2011) REVIGO总结并可视化了基因本体术语的长列表。《公共科学图书馆•综合》6: e21800。(Crossref)
- 翟莹,Kuick R, Nan B, Ota I, Weiss SJ等。(2007)侵袭前和侵袭性宫颈鳞状细胞癌基因表达分析发现HOXC10是侵袭的关键介质。癌症Res67: 10163 - 72。
- Hansen KD, Timp W, Bravo HC, Sabunciyan S, Langmead B等。(2011)不同癌症类型表观遗传域甲基化变异的增加。Nat麝猫43: 768 - 75。
- Teschendorff AE, Widschwendter M(2012)在DNA甲基化研究中,差异变异性提高了对癌症前体病变的风险标记的识别。生物信息学28日:1487 - 94。
- 李建军,李建军,李建军,等(2002)人类基因组中CpG岛的基因标记。基因组学13: 1095 - 1107。(Crossref)
- Lendvai A, Johannes F, Grimm C, Eijsink JJ, Wardenaar R,等。(2012)高级别宫颈上皮内瘤变中高甲基化生物标志物的全基因组甲基化谱分析。表观遗传学7: 1268 - 78。[Crossref]
- Martin-Sanchez E, Mendaza S, Ulazia-Garmendia A, Monreal-Santesteban I, Cordoba A,等。(2017)CDH22高甲基化是乳腺癌预后的独立生物标志物。中国实验胚胎学9: 7。[Crossref]
- 高刚,史密斯迪。(2016)常见脆性位点在人类乳头瘤病毒病因癌症中的作用。中国生物医学工程学报(英文版);2016;31(2):557 - 557。[Crossref]
- 沈君ther J,王春明,Poage GM,林春林,Perez L,等。(2016)分子巴氏涂片:HPV基因型和ADCY8、CDH8和ZNF582 DNA甲基化作为高级别宫颈细胞学的综合生物标志物。临床实验胚胎学8: 96。[Crossref]
- 陈玉春,黄瑞玲,黄玉坤,廖玉萍,苏鹏华,等。(2014)甲基组学分析鉴定表观遗传沉默基因并暗示β -连环蛋白信号在宫颈癌中的激活。国际癌症杂志,35:117-27。[Crossref]
- 刘美梅,张华,胡玉娟,陈亚文,赵小娜(2016)转录组芯片和甲基化芯片综合分析宫颈癌相关关键基因。肿瘤的信件12: 473 - 8。
- 张建军,张建军,张建军,等(2014)HPV阳性妇女宫颈上皮内瘤变的DNA甲基化检测。Gynecol杂志132: 709 - 14所示。[Crossref]
- 苏华,冯琦,吴国强,等。(2006)基于微阵列分析的宫颈癌甲基化生物标志物的发现。癌症流行病学生物标志物预防15: 114 - 23所示。[Crossref]
- 钟美婷,王雪峰,闫东明,施玉玲,张春春等。(2009)宫颈癌SFRPs基因家族启动子甲基化的研究。Gynecol杂志112: 301 - 306。(Crossref)
- 克拉维罗R,科斯达S, Pinto D, Salgado L, Carvalho L等。(2004)TP73在宫颈癌中的表达。癌症基因细胞基因150: 116 - 21所示。[Crossref]
- 陈建军,陈建军,陈建军,等。(2007)人乳头状瘤病毒诱导宫颈癌的基因启动子甲基化。癌症97: 1457 - 64。[Crossref]
- 邓文娟,王顺生,王淑娟,王文娟,等。(2015)乳头瘤病毒感染对宫颈癌前期和癌症的分子转化:基质雌激素受体信号的作用。美国国家科学基金委112: e3255 - 64。[Crossref]
- Yadav SS, Prasad SB, Prasad CB, Pandey LK, Pradhan S等。(2016)CXCL12是宫颈癌肿瘤微环境关键调控因子的体外研究。临床试验转移33: 431 - 9。[Crossref]
- Shukla HD, Mahmood J, Vujaskovic Z(2015)综合蛋白质基因组学方法在癌症早期诊断和预后中的应用。癌症列托人369:几个。[Crossref]
- Sproul D, Kitchen RR, Nestor CE, Dixon JM, Sims AH等。(2012)组织起源决定癌症相关的CpG岛启动子超甲基化模式。基因组医学杂志13: R84。[Crossref]
- Farkas SA, Milutin-Gasperov N, Grce M, Nilsson TK(2013)全基因组DNA甲基化分析揭示宫颈癌新的候选生物标志物基因。表观遗传学8: 1213 - 25。[Crossref]
- 侄子KP(2009)如何获得早期宫颈癌检测的DNA甲基化标记?Gynecol杂志112: 291 - 2。
- 陈建平,陈建平,陈建平(2009)肿瘤DNA甲基化:分子机制和临床意义。临床癌症研究中心15: 3927 - 3937。(Crossref)
- 陈志强,陈志强,陈志强,等(2010)肿瘤细胞DNA甲基化的研究进展。阿香猫70: 277 - 308。(Crossref)
- Satow R, Shitashige M, Kanai Y, Takeshita F, Ojima H等。(2016)肝细胞癌治疗靶点的联合功能基因组调查。临床癌症研究中心16: 2518 - 28。[Crossref]
- 王宁,詹婷,柯婷,黄霞,柯东,等。(2014)人乳头瘤病毒E7癌蛋白RRM2表达增加促进宫颈癌血管生成。癌症110: 1034 - 44。[Crossref]
- Campos-Parra AD, Padua-Bracho A, Pedroza-Torres A, Figueroa-Gonzalez G, Fernandez-Retana J等。(2016)综合转录组分析确定局部晚期宫颈癌的治疗潜力通路。Gynecol杂志143: 406 - 13所示。[Crossref]
- Karim S, al - maghrabi JA, Farsi HM, al - sayyad AJ, Schulten HJ等。(2016)Cyclin D1作为肾细胞癌的治疗靶点——来自沙特阿拉伯王国的转录组学、组织微阵列和分子对接研究。BMC癌症16: 741。[Crossref]