文本


看看最近的文章

识别转录因子结合位点的改变

Buroker不

美国华盛顿大学儿科学系

电子邮件:bhuvaneswari.bibleraaj@uhsm.nhs.uk

DOI: 10.15761 / FNDM.1000101

文章
条信息
作者信息
数据与数据

摘要

位于人类基因组非编码区域的snp已被发现与疾病显著相关,可能通过改变转录因子(TF)的结合位点来影响基因调控。已经有一些SNP研究用于识别可能影响基因调控的转录因子结合位点(TFBS)的惩罚性变化,但一直缺乏这些变化的构象。结合这些先前的SNP研究,我们对HaploReg和RegulomeDB数据库进行了研究,以寻找可能影响基因表达的构象TF基序和蛋白质结合变化。这项调查已经导致了先前研究中的一些惩罚性TFBS变化与在这些数据库中发现的验证变化的实验证据之间的一致。这些变化与可能导致疾病的基因表达变化的关系被讨论。

关键字

基因调控;非编码DNA;rSNPs;TFBS;人类疾病

简介

非编码DNA占人类基因组[1]的98%。全基因组关联研究(GWAS)表明,大约93%的疾病或性状易感单核苷酸多态性(SNPs)被认为与基因调控相关,落在这些非编码区域[2-4]。在人群中发现对一种疾病或疾病具有统计学意义的snp被认为是导致基因表达水平[4]变化的风险相关snp。转录因子基序或转录因子结合位点(TFBS)中单个核苷酸的改变都可能影响基因调控过程[5-7]。在基序中出现的SNP可能增加或减少相应的转录因子(TF)结合DNA的能力,从而导致等位基因特异性表达[8]。一些研究已经确定了由调控(r) snp引起的惩罚性TFBS的变化与人类疾病或疾病显著相关[9-20]。然而,在迄今为止的这些研究中,还没有任何结论性的证据表明TF的改变可能导致特定的疾病或疾病。在之前的研究中,为了解决这一问题,我们对HaploReg[21]和RegulomeDB[22]数据库进行了筛选,以寻找由致病等位基因替换产生的TFBS,该突变可能改变导致疾病的基因调节。

HaploReg数据库是一种工具,用于检查已发表的GWAS研究中非编码基因组的注释,而RegulomeDB则指导使用ENCODE项目的实验数据集解释人类基因组中的调控变异。RegulomeDB还进行计算预测,以确定假定的调节潜力和功能变异。在本报告中,这些分析对先前研究的9个基因进行了分析,这些基因的rSNPs与疾病或疾病显著相关[9-20]。

材料和方法

基因和rSNPs

该表列出了9个rSNP已被证明与疾病或疾病显著相关的基因(见结果)[9-20],以及rSNP等位基因和频率。两个SNP等位基因之间的保守TFBS数量以及之前确定的每个等位基因的唯一TFBS数量[9-20]都包含在表中。保守的和唯一的TFBS的名称可以在以前的研究[9-20]中找到,参考表中的基因符号。

识别TFBS

在以往的研究[9-20]中,使用JASPAR CORE数据库[23,24]和ConSite[25]对TFBS进行识别。JASPAR是转录因子dna结合偏好的集合,用于扫描基因组序列,而ConSite是一个基于web的工具,用于寻找基因组序列中的顺式调控元素。Vector NTI Advance 11计算机程序(Invitrogen, Life Technologies)用于定位表中列出的所有基因中的SNPs和TFBS。

HaploReg和RegulomeDB

HaploReg在一定程度上是一种资源,用于探索遗传关联变体[21]组中的调控基序改变。RegulomeDB指导解释人类基因组[22]中的调控变异。这两个数据库用于检测表中所列基因调控区域内snp所产生的变化。表中报道了来自两个数据库的TFBS与之前研究[9-20]生成的TFBS的构象。有关转录因子和/或蛋白质的描述或功能,请参阅附录。

结果

肾上腺素受体激酶1 (ADRBK1)基因是肾上腺素能信号的重要调节因子,在心衰病理中起着核心作用,该基因有两个rSNPs (rs948988和rs4370947),这些rSNPs的TFBS[11]被分析为与HaploReg和RegulomeDB数据库的结合位点验证(表)。rs948988 rSNP的两个等位基因(G/A)在两个等位基因之间产生7个保守的惩罚性TFBS,而普通等位基因G产生额外的2个独特的TFBS,次要等位基因A产生额外的10个独特的TFBS。在A等位基因产生的10-惩罚性独特TFBS中,核因子红系2相关因子(NFE2) BS也在该rSNP的HaploReg数据库中找到(表)。NFE2通过抗氧化反应元件(ARE)协调细胞保护基因的上调。rs4370946 rSNP的两个等位基因(C/T)在两个等位基因之间产生3个保守的惩罚性TFBS,而普通等位基因C产生额外的12个独特的TFBS,次要等位基因T产生额外的5个独特的TFBS。在C等位基因产生的12-惩罚性独特TFBS中,b细胞1 (NFKB1) BS中的kappa轻多肽基因增强子的核因子也在该rSNP的HaploReg数据库中找到(表)。NFKB1是一种几乎存在于所有细胞类型中的多效转录因子,是一系列信号转导事件的终点,这些事件是由与许多生物过程相关的大量刺激启动的,如炎症、免疫、分化、细胞生长、肿瘤发生和凋亡。

v-akt小鼠胸腺瘤病毒致癌基因同源物3 (AKT3)基因是AKTs的三个亚型之一,AKTs是通过PI3K发出信号的生长因子受体酪氨酸激酶的主要下游靶点,有四个rSNPs (rs4590656, rs12031994, rs10157763和rs2125230),其惩罚TFBS[9]与HaploReg和RegulomeDB数据库进行结合位点验证(表)。rs4590656和rs12031994 rsnp分别产生2个和6个保守的惩罚性TFBS(表)。叉头盒a1和a2基因被发现在rs4590656 rSNP的两个等位基因(C/T)之间保守,也在该rSNP的HaploReg数据库中发现(表)。干扰素调节因子1 (IRF1)和性别决定区Y (Sox)被发现在rs12031994 rSNP的两个等位基因(G/A)之间保守,也在该rSNP的HaploReg数据库中发现(表)。rs10157763 rSNP在两个(C/T)等位基因之间产生4个保守的惩罚性TFBS,对普通C等位基因产生另外5个独特的惩罚性TFBS,对次要T等位基因产生4个独特的TFBS(表)。在由小T等位基因产生的四种独特的惩罚性TFBS中,cctc结合因子(锌指蛋白)(CTCF) BS也在该rSNP的HaploReg和RegulomeDB数据库中找到(表)。rs2125230 rSNP在两个(G/A)等位基因之间产生两个保守的惩罚性TFBS,在G等位基因上产生另外四个独特的惩罚性TFBS,在A等位基因上产生另外九个独特的惩罚性TFBS(表)。在由小A等位基因产生的9个唯一的惩罚性TFBS中,叉头盒A1 (Foxa) BS也在该rSNP的HaploReg数据库中找到(表)。

激活转录因子3 (ATF3)基因,该基因是转录因子激活转录事实/cAMP响应元件结合(CREB)蛋白家族的成员,具有一个rSNP (rs11119982),其惩罚性TFBS[10]被分析,并与HaploReg和RegulomeDB数据库进行结合位点验证(表)。rs11119982 rSNP为普通C等位基因生成6个保守的惩罚性TFBS和1个额外的独特TFBS,为次要T等位基因生成5个额外的独特TFBS(表)。在针对A等位基因的5种额外的独特的惩罚性TFBS中,自然杀手2 (NKX2) BS也在该rSNP的HaploReg数据库中找到(表)。NKX2 TF作为软骨细胞成熟的负调控因子。

2型去碘酶(DIO2)基因编码一种去碘酶,该酶将甲状腺原激素甲状腺素(T4)转化为具有生物活性的三碘甲状腺原氨酸(T3)。T3参与调节能量平衡和葡萄糖代谢。六个rsnpDIO2对其惩罚性TFBS[12]基因进行分析,并与HaploReg和RegulomeDB数据库进行结合位点验证(表)。rs12885300、rs225010和rs225011 rsnp分别含有TFBS PRDM1、Pax和rror1,且分别含有每个SNP的两个等位基因。rs225013 rSNP为普通G等位基因生成1个保守的惩罚性TFBS和2个附加的独特的TFBS,为次要T等位基因生成9个附加的独特的惩罚性TFBS。在T等位基因的9个额外独特的TFBS中,肝细胞核因子1- α (HNF1a)和配对盒基因2 (Pax)也在该rSNP的HaploReg数据库中被发现(表),其中HNF1a是一个调节几个肝脏基因表达的TF, Pax是一个在肾细胞分化中发挥作用的TF。rs225014 rSNP对两个等位基因均具有RXRTFBS。HaploReg和RegulomeDB数据库显示CTCF、RAD21、SMC3、MAX、YY1和cMYC转录因子与该SNP位点的DNA结合(表)。rs6574549 rSNP被发现有7个保守的惩罚性TFBS和5个额外的唯一的普通T等位基因的TFBS和4个额外的唯一的小G等位基因的TFBS(表1)。NK2同源盒子1 (Nkx2)也被称为甲状腺核因子1和NK3同源盒子1 (Nkx3)对该SNP的两个等位基因都有TFBS。在该SNP的普通T等位基因的5个额外独特的TFBS中,在HaploReg和RegulomeDB数据库中发现了AT富相互作用域3A (Arid3a) BS(表)。在SNP小G等位基因的4个额外的唯一TFBS中,POU class 2 homeobox 2 (Pou2f2)是HaploReg和RegulomeDB数据库的BS(表)。

内皮Per-Arnt-Sim (PAS)结构域蛋白1 (EPAS1)编码缺氧诱导因子-2 α (HIF2)是一个参与对缺氧反应的TF。两个EPAS1对惩罚TFBS[13]的rSNPs (rs6756667和rs7589621)进行分析,与HaploReg和RegulomeDB数据库进行结合位点验证(表)。rs6756667 rSNP (A/G)在两个等位基因中都有22个保守的惩罚性TFBS,其中活化转录因子4 (ATF4) TFBS在两个等位基因中都出现。rs7589621 rSNP (G/A)在两个等位基因中都有27个保守的惩罚性TFBS,其中糖皮质激素调节元件结合蛋白2 (GMEB2)、NK2同型盒子1 (Nkx2)也被称为甲状腺核因子1、NK3同型盒子1 (Nkx3)和POU 2类同型盒子2 (Pou2f2) TFBS与该SNP的两个等位基因均存在。

溶酶体酸性脂肪酶A (脂肪酶)基因转录溶酶体酸性脂肪酶(LAL),该酶可水解细胞溶酶体中的胆固醇酯和甘油三酯,产生游离胆固醇和脂肪酸。两个脂肪酶对惩罚TFBS[14]的rSNPs (rs2246833和rs1412444)进行分析,并与HaploReg和RegulomeDB数据库进行绑定位点验证(表)。rs2246833 rSNP (C/T)在两个等位基因中有5个保守的惩罚性TFBS, 3个附加的与普通C等位基因的独特TFBS和1个附加的与次要T等位基因的TFBS(表)。在三种附加的独特TFBS中,锌指蛋白143 (ZNF143) TFBS也在HaploReg和RegulomeDB数据库中被发现(表)。在HaploReg和RegulomeDB数据库中,已经发现CTCF TF与该SNP位点结合(表)。rs1412444 rSNP (C/T)在2个等位基因中有13个保守的惩罚性TFBS, 5个附加的独特TFBS与普通C等位基因发生,12个附加的独特TFBS与次要T等位基因发生。ELK1, ELK4, FEV, FLI1, GABPA TFBS同时具有这两种等位基因,而蛋白C-ets-1 (Ets1) TFBS只具有主要的C等位基因。

信号换能器及转录激活器4 (STAT4)基因对于白介素(IL-12和IL-23)和1型干扰素的信号传递非常重要。三个STAT4对惩罚TFBS[15]的rSNPs (rs11889341, rs8179673和rs7572482)进行分析,与HaploReg和RegulomeDB数据库进行结合位点验证(表)。发现rs11889341 rSNP (C/T)在两个等位基因中有7个保守的惩罚性TFBS, 3个附加的与普通C等位基因的独特TFBS, 15个与次要T等位基因的独特TFBS(表)。在共有T等位基因附加的15个独特的TFBS中,Foxo1 TFBS也在HaploReg和RegulomeDB数据库中被发现(表)。Foxo1 TF是胰岛素信号转导的主要靶点,调节氧化应激的代谢稳态。发现rs8179673 rSNP (T/C)在两个等位基因中有8个保守的惩罚性TFBS, 9个附加的与普通T等位基因的独特TFBS, 15个与次要C等位基因的独特TFBS(表)。在这两个等位基因的保守TFBS中,叉头盒(Fox)、SRY(性别决定区域Y) (Sox)和塔塔盒结合蛋白(TBP)也在HaploReg和RegulomeDB数据库中被发现(表)。在共有T等位基因的9个独特的TFBS中,在HaploReg和RegulomeDB数据库中也发现了AT富相互作用域3A (Arid3a) TFBS(表)。在小C等位基因的15个独特的TFBS中,肝细胞核因子1和4 (HNF1和4)也在HaploReg和RegulomeDB数据库中找到(表)。HNF1 & 4调节多种基因的组织特异性表达,尤其是在胰岛细胞和肝脏中。rs7572482 rSNP (A/G)在2个等位基因中有4个保守的惩罚性TFBS,与普通A等位基因有8个独特的TFBS,与小G等位基因有4个独特的TFBS。 Of the unique TFBS for the A allele, the POU Class 5 Homeobox 1 (POU5F1) and SRY (sex determining region Y) (Sox) TFs form a trimeric complex on DNA and controls the expression of a number genes involved in embryonic development. These TFBS were also found in the HaploReg and RegulomeDB databases (Table). Also among the unique TFBS for the A allele, the early B-cell factor 1 (EBF1) has a BS for the bound protein as reported in the HaploReg and RegulomeDB databases (Table).

血栓素A2受体(TBXA2R)基因调节不同的下游信号级联,诱导细胞内钙流入、细胞迁移、增殖和凋亡等多种细胞反应。三个TBXA2R对惩罚TFBS[26]的rSNPs (rs2238633, rs2238634和rs4523)进行分析,与HaploReg和RegulomeDB数据库进行绑定位点验证(表)。rs2238633 rSNP (G/T)在两个等位基因中具有两个保守的惩罚性TFBS,在普通G等位基因中具有两个独特的TFBS,在小T等位基因中具有两个独特的TFBS(表)。kruepel -like factor 4 (Klf4) TFBS在两种等位基因中均有发生。Klf4转录因子在胚胎发育过程中调控关键转录因子的表达。rs2238634 rSNP (G/T)在两个等位基因中有一个保守的惩罚性TFBS,与小T等位基因有5个独特的TFBS(表)。锌指x染色体蛋白(ZFX) TFBS在这两个等位基因中均有发生。ZFX TF是krueppel c2h2型锌指蛋白家族的成员,可能是一种转录激活因子。在与小T等位基因一起发现的5种独特的TFBS中,在HaploReg数据库(表)中发现了肝细胞核因子4 (HNF4) BS,同时也发现了HNF4结合蛋白与该rSNP位点的证据。HNF4调节几个肝脏基因的组织特异性表达。rs4523 rSNP (T/C)在两个等位基因中有5个保守的惩罚性TFBS,在普通T等位基因中有4个独特的TFBS,在次要C等位基因中有5个独特的TFBS。 The protein C-ets-1 (Ets1) TFBS was found to occur among both alleles. The Ets1 TF has been shown to interact with Tyrosyl-DNA Phosphodiesterase 2 (TTRAP), Ubiquitin Conjugating Enzyme E2 I (UBE2I) and death associated proteins. Of the four unique TFBS for the common T allele, the nuclear receptor subfamily 3 group C member 1 (GR) TFBS was found in the HaploReg database (Table). The protein acts as a regulator of other TFs and affects inflammatory responses, cellular proliferation and differentiation in target tissues.

血管内皮生长因子A (VEGFA)基因转录一种参与血管生成、血管生成和内皮细胞生长调控的信号蛋白。在HaploReg和RegulomeDB数据库中分析6个VEGFA rSNPs (rs699947, rs79469752, rs13207351, rs28357093, rs1570360和rs2010963)对TFBS的惩罚性[18,20,27,28](表)。发现rs699947 rSNP (C/A)对两个等位基因都能产生两个保守的惩罚性TFBS,对共有C等位基因产生三个独特的TFBS,对次要A等位基因产生一个独特的TFBS(表)。转录因子CP2-like 1(Tcfcp2l1) BS与两种等位基因一起出现(表),TF作为抑制因子。发现rs79469742 rSNP (C/T)对两个等位基因都产生一个保守的惩罚性TFBS,对普通C等位基因产生三个独特的TFBS,对次要T等位基因产生六个独特的TFBS(表)。配对框5 (Pax5) TFBS与两种等位基因一起发生(表),TF在早期发育中是一个重要的调节因子,基因表达的改变被认为有助于肿瘤转化。如HaploReg和RegulomeDB数据库所示,该TF被绑定在这个rSNP位点上(表)。研究发现,rs13207351 rSNP (G/A)可以为两个等位基因创建一个保守的惩罚性TFBS,为普通G等位基因创建一个额外的独特TFBS,为次要A等位基因创建两个额外的独特TFBS(表)。核呼吸因子1 (Nrf1) TFBS与这两种等位基因一起发生(表)。TF激活调节细胞生长的关键代谢基因的表达,以及呼吸、血红素生物合成、线粒体DNA转录和复制所需的核基因的表达。 Of the two-unique punitive TFBS occurring with the minor A allele, the paired box 5 (Pax5) TFBS was also found in the HaploReg and RegulomeDB databases (Table). The rs283570360 rSNP (A/C) was found to create one conserved punitive TFBS for both alleles and two additional unique TFBS for the common A allele and two additional unique TFBS for the minor C allele (Table). The nuclear respiratory factor 1 (Nrf1) TFBS was found to occur with both of the alleles (Table). Of the two-additional unique TFBS occurring with the common A allele, the E2F transcription factor 6 (E2F6) TFBS was found in the HaploReg and RegulomeDB databases (Table). The E2F6 TF has been found bound to the DNA at this rSNP site as reported in the HaploReg and RegulomeDB databases (Table). The TF plays a role in the control of cell cycle and action of tumor suppressor proteins and is also a target of the transforming proteins of small DNA tumor viruses. The rs1570360 rSNP (G/A) was found to create five conserved punitive TFBS for both alleles and three additional unique TFBS for the common G allele and six additional unique TFBS for the minor A allele (Table). The specificity protein 1 (SP1) TF has been reported to be bound to its TFBS for both alleles at this rSNP site as reported in the HaploReg and RegulomeDB databases (Table). The SP1 TF can activate or repress transcription in response to physiological and pathological stimuli. It regulates the expression of a large number of genes involved in a variety of processes such cell growth, apoptosis, differentiation and immune responses. Of the three-additional unique TFBS of the common G allele, the early growth response 1 (EGR1) TF binds the DNA at the G-allele rSNP site as reported in the HaploReg and RegulomeDB databases (Table). The TF plays a role in differentiation and mitogenesis. The rs2010963 rSNP (C/G) was found to create one conserved punitive TFBS for both alleles and three additional unique TFBS for the common C allele and one additional unique TFBS for the minor G allele (Table). Of the three-additional unique TFBS for the common C allele, the interferon regulatory factor 1 (IRF1) TFBS was also found in the HaploReg and RegulomeDB databases (Table). The TF has been shown to play roles in regulating apoptosis and tumor-suppression.

表1。九个基因的rSNPs先前已被证明与疾病有关。列出的是SNP等位基因,该等位基因的保守惩罚TFBS的数量和每个等位基因的唯一TFBS。参考资料TFBS的名称,描述和DNA序列。还列出了从实验数据的HaploReg和RegulomeDB数据库中获得的TF基序变化和每个SNP等位基因与惩罚性TFBS相匹配的蛋白质结合。MAF是次要等位基因频率。蛋白质/转录因子的名称和描述或功能见补充。

基因

rSNP

等位基因

守恒的

独特的

主题的变化

蛋白质绑定

(Ref)

(加)

TFBS

TFBS

HaploReg

RegulomeDB

HaploReg & RegulomeDB

ADRBK1

rs948988

G

7

2

11

(0.29)

10

NFE2

rs4370946

C

3.

12

NFKB1

T (0.2)

5

AKT3

rs4590656

C

2

2

Foxa

9

T (0.40)

4

Foxa

rs12031994

G

6

8

IRF、袜

(0.17)

8

IRF、袜

rs10157763

C

4

5

T (0.4)

4

CTCF

CTCF

rs2125230

G

2

4

(0.28)

9

Foxa

ATF3

rs11119982

C

6

1

10

T (0.32)

5

NKX2

DIO2

rs12885300

C

4

0

PRDM1

12

T (0.23)

6

PRDM1

rs225010

C

5

6

罗马帝国

T (0.42)

4

罗马帝国

rs225011

C

8

2

RORa1

RORa1

T (0.42)

3.

RORa1

RORa1

rs225013

G

1

2

T (0.36)

9

HNF1,罗马帝国

rs225014

T

4

5

RXRa

CTCF、RAD21 SMC3,马克斯,YY1 cMYC

C (0.42)

6

RXRa

CTCF、RAD21 SMC3,马克斯,YY1 cMYC

rs6574549

T

7

5

Arid3a、Nkx2 Nkx3

Nkx2, Nkx3

G (0.01)

4

Foxa、Nkx2 Nkx3 Pou2F2

Nkx2, Nkx3

EPAS1

rs6756667

一个

22

13

ATF4

13

G (0.31)

9

ATF4

rs7589621

G

27

10

Nkx2、Nkx3 Pou2f2

GMEB2, Nkx2-3

(0.25)

11

Nkx2、Nkx3 Pou2f2

GMEB2, Nkx2-3

脂肪酶

rs2246833

C

5

3.

ZNF143

ZNF143

CTCF

14

T (0.42)

1

CTCF

rs1412444

C

13

5

Ets1, FEV

ELK1、ELK4 Ets1, FEV FLI1 GABPA

T (0.42)

12

FEV

ELK1 ELK4, FEV、FLI1 GABPA

STAT4

rs11889341

C

7

3.

15

T (0.34)

15

Foxo1

rs8179673

T

8

9

袜,Arid3a真沸点

福克斯,袜,真沸点

C (0.26)

15

HNF1, HNF4, Sox, TBP

福克斯,袜,真沸点

rs7572482

一个

4

8

Pou5f1, Sox2

Pou5f1

EBF1

G (0.47)

4

TBXA2R

rs2238633

G

2

2

Klf4

26

T (0.22)

2

Klf4

rs2238634

G

1

0

ZFX

T (0.22)

5

HNF4, ZFX

HNF4

rs4523

T

5

4

Ets1, GR

C (0.20)

5

Ets1

VEGFA

rs699947

C

2

3.

Tcfcp2l1

16日,18 - 20

(0.17)

1

Tcfcp2l1

rs79469752

C

1

3.

Pax5

Pax5

T (0.05)

6

Pax5

Pax5

rs13207351

G

1

1

Nrf1

Nrf1

(0.31)

2

Nrf1

Pax5

Nrf1, Pax5

rs28357093

一个

1

2

Nrf1

E2F6

E2F6

C (0.1)

2

Nrf1

rs1570360

G

5

3.

EGR1, SP1

(0.09)

6

SP1

rs2010963

C

1

3.

IRF1

G (0.43)

1

讨论

经GWAS鉴定的与人类疾病显著相关的非编码snp被认为是风险相关snp[4]。那些靠近导致基因表达水平变化的基因被认为是调控(r) snp[29]。这些位于TFBS中的snp可以改变各自TF的结合能力。已经有很多报道通过基于与一种疾病相关的rSNP的两个等位基因来识别惩罚性TFBS的可能结果[9-20]。然而,这些研究只能预测与疾病相关的惩罚性TFBS的可能性。对HaploReg[21]和RegulomeDB[22]数据库进行筛选,以支持先前研究中报告的TF基序可能导致基因表达改变的证据。调查结果载于下表。

举个例子ADRBK1在黑人人群中与心血管疾病相关的基因有一个3'UTR rSNP rs4370946,其共同的C等位基因产生一个NFKB1 (b细胞中kappa轻多肽基因增强子核因子1)TFBS,但不与次要的T等位基因[11],也报道在HaploReg中有motif改变(表)。NFKB1是一种几乎存在于所有细胞类型中的多效转录因子,是一系列信号转导事件的终点,这些事件是由与许多生物过程相关的大量刺激启动的,如炎症、免疫、分化、细胞生长、肿瘤发生和凋亡。消除了NFKB1结合位点与ADRBK1rs4370946-T等位基因很可能与黑人的心血管疾病有关。

另一个例子是AKT3与侵袭性前列腺癌相关的基因有一个内含子rSNP rs10157761,其小T等位基因产生一个CTCF (cctc结合因子)TFBS,但不发生在普通C等位基因[9]中,据报道,在HaploReg和RegulomeDB数据库中也有motif改变(表)。CTCF是一种具有11个高度保守的锌指结构域(ZF)的转录调节蛋白,能够使用ZF结构域的不同组合结合DNA靶序列和蛋白质。CTCF作为绝缘体,干扰增强子和启动子[30]之间的相互作用。消除了CFCT结合位点与AKT3rs10157761-C等位基因可能与前列腺癌相关。其他例子可从表中获得。

总之,将先前在HaploReg和RegulomeDB数据库中发现的实验证据与由rSNP等位基因产生的TFBS名称的计算研究相匹配[9-20],可以得出最有可能导致疾病或疾病的TFBS和致病rSNP等位基因。这一过程将把研究重点缩小到少数或单个负责导致疾病的基因表达交替的TF。

辅助数据视图

参考文献

  1. oettting WS, Béroud C, Brenner SE, Greenblatt M, Karchin R,等(2017)非编码变异:人类基因组变异学会2016年年度科学会议。哼Mutat(crossref)
  2. Hindorff LA, Sethupathy P, Junkins HA, Ramos EM, Mehta JP,等(2009)人类疾病和性状全基因组关联位点的潜在病原学和功能意义。美国国家科学研究院106: 9362 - 9367。(crossref)
  3. Kumar V, Westra HJ, Karjalainen J, Zhernakova DV, Esko T et al.(2013)人类疾病相关的遗传变异影响大量基因间非编码RNA表达。公共科学图书馆遗传学9: p . e1003201。(crossref)
  4. Tak YG, PJ Farnham(2015)理解GWAS:使用表观基因组学和基因组工程来理解人类基因组非编码区域snp的功能相关性。表观遗传学染色质8: 57页。(crossref)
  5. 非编码DNA遗传变异对疾病易感性和基因调控的功能意义。Sci (Lond)104: 493 - 501。(crossref)
  6. 王鑫,Tomso DJ,刘鑫,Bell DA(2005)环境响应基因转录调控区单核苷酸多态性与表达。Toxicol:杂志207(2增刊):第84-90页。(crossref)
  7. Chorley BN, Wang X, Campbell MR, Pittman GS, Noureddine MA et al.(2008)调控基因组区功能单核苷酸多态性的发现和验证:当前和发展中的技术。Mutat Res659: 147 - 57。(crossref)
  8. burke NE(2016)从与疾病或疾病显著相关的调控性单核苷酸多态性中识别惩罚性转录因子结合位点的变化。世界J血液学5: 75 - 87。
  9. burker NE (2013) AKT3 rSNPs,转录因子结合位点与人类疾病。开放血液疾病杂志3: 116 - 129。
  10. burroker NE (2013) ATF3 rSNPs,转录因子结合位点和人类病原学。开放遗传学杂志3: 253 - 261。
  11. burker NE(2014)黑人人群中ADRBK1 (GRK2) rSNPs、转录因子结合位点与心血管疾病。心血管疾病杂志2.
  12. Buroker NE (2014) DIO2 rSNPs,转录因子结合sit2021版权所有。版权归医学与医学研究所有9: - 24。
  13. burroker NE(2016)计算EPAS1 rSNP分析,转录因子结合位点和高原反应或适应。蛋白质组学与基因组学研究杂志1: 31-59。
  14. burker NE (2015) LIPA rSNPs (rs1412444和rs2246833),转录因子结合位点和疾病。英国生物医学公告3: 281 - 294。
  15. burker NE (2016) STAT4 rSNP计算分析,转录因子结合位点与疾病。生物信息学和糖尿病1: 1-36。
  16. burroker NE (2014) VEGFA rSNPs、转录因子结合位点与人类疾病。杂志Sci64: 73 - 76。(crossref)
  17. burker NE (2015) VEGFA snp (rs34357231 & rs35569394),转录因子结合位点与人类疾病。英国医学与医学研究杂志10: 1 - 11。
  18. burroker NE,宁晓红,李坤,周志宁,岑文杰等。(2015)青藏高原汉族人急性高原病snp、连锁失衡和转录因子结合位点的研究。国际基因组医学杂志3.
  19. burroker NE,宁晓红,周楠楠,李坤,岑文杰等(2013)青藏高原汉族和藏族人高海拔病相关VEGFA snp及其转录因子结合位点的研究。生理科学杂志, 63: 183 - 193。(crossref)
  20. Buroker NE (2014) VEGFA启动子转录因子结合位点的SNP (rs1570360)与高血压肾病和糖尿病视网膜病变相关。奥斯汀内分泌学和糖尿病杂志2: 5。
  21. 沃德·LD, M·凯利斯(2012)HaploReg:一种用于探索遗传连锁变异集内染色质状态、守恒和调控基序改变的资源。核酸Res40: 930 - 4。(crossref)
  22. Boyle AP1, Hong EL, Hariharan M, Cheng Y, Schaub MA,等(2012)利用RegulomeDB注释个人基因组的功能变异。基因组Res22日:1790 - 1797。(crossref)
  23. Bryne JC, Valen E, Tang MH, Marstrand T, Winther O等人(2008)JASPAR,转录因子结合图谱的开放获取数据库:2008年更新的新内容和工具。核酸Res36:102-6。(crossref)
  24. Sandelin A, Alkema W, Engström P, Wasserman WW, Lenhard B (2004) JASPAR:一个开放获取的真核转录因子结合图谱数据库。核酸Res32: D91-4。(crossref)
  25. Sandelin A, WW Wasserman, B Lenhard (2004) ConSite:基于网络的利用跨物种比较的调控元素预测。核酸Res32.
  26. burker NE (2014) TBXA2R rSNPs,转录因子结合位点与亚洲人哮喘。开放儿科杂志4.
  27. burroker NE (2014) VEGFA rSNPs、转录因子结合位点与人类疾病。杂志Sci64: 73 - 76。(crossref)
  28. burroker NE (2014) KLF4和SP1 TFBS中的ADRBD1 (GRK2)、TBXA2R和VEGFA rSNPs表现出连锁不平衡。开放遗传学杂志4.
  29. Bahreini A, Levine K, Santana-Santos L, Benos PV, Wang P等(2016)影响雌激素受体结合和活性的非编码单核苷酸变异。基因组医学8:1。
  30. Ong CT, Corces VG1 (2014) CTCF:连接基因组拓扑和功能的架构蛋白。Nat牧师麝猫15: 234 - 246。(crossref)

编辑信息

主编

文章类型

研究文章

出版的历史

收稿日期:2017年2月14日
录用日期:2017年2月21日
出版日期:2017年2月24日

版权

©2017 Buroker NE。这是一篇开放获取的文章,根据创作共用署名许可协议(Creative Commons Attribution License)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。

引用

burroker NE, et al.(2016))识别转录因子结合位点的改变。胎儿,新生儿和发育医学,1:DOI: 10.15761/FNDM.1000101

相应的作者

诺曼·e·Buroker

华盛顿大学儿科学系,西雅图,华盛顿州98195

表1。九个基因的rSNPs先前已被证明与疾病有关。列出的是SNP等位基因,该等位基因的保守惩罚TFBS的数量和每个等位基因的唯一TFBS。参考资料TFBS的名称,描述和DNA序列。还列出了从实验数据的HaploReg和RegulomeDB数据库中获得的TF基序变化和每个SNP等位基因与惩罚性TFBS相匹配的蛋白质结合。MAF是次要等位基因频率。蛋白质/转录因子的名称和描述或功能见补充。

基因

rSNP

等位基因

守恒的

独特的

主题的变化

蛋白质绑定

(Ref)

(加)

TFBS

TFBS

HaploReg

RegulomeDB

HaploReg & RegulomeDB

ADRBK1

rs948988

G

7

2

11

(0.29)

10

NFE2

rs4370946

C

3.

12

NFKB1

T (0.2)

5

AKT3

rs4590656

C

2

2

Foxa

9

T (0.40)

4

Foxa

rs12031994

G

6

8

IRF、袜

(0.17)

8

IRF、袜

rs10157763

C

4

5

T (0.4)

4

CTCF

CTCF

rs2125230

G

2

4

(0.28)

9

Foxa

ATF3

rs11119982

C

6

1

10

T (0.32)

5

NKX2

DIO2

rs12885300

C

4

0

PRDM1

12

T (0.23)

6

PRDM1

rs225010

C

5

6

罗马帝国

T (0.42)

4

罗马帝国

rs225011

C

8

2

RORa1

RORa1

T (0.42)

3.

RORa1

RORa1

rs225013

G

1

2

T (0.36)

9

HNF1,罗马帝国

rs225014

T

4

5

RXRa

CTCF、RAD21 SMC3,马克斯,YY1 cMYC

C (0.42)

6

RXRa

CTCF、RAD21 SMC3,马克斯,YY1 cMYC

rs6574549

T

7

5

Arid3a、Nkx2 Nkx3

Nkx2, Nkx3

G (0.01)

4

Foxa、Nkx2 Nkx3 Pou2F2

Nkx2, Nkx3

EPAS1

rs6756667

一个

22

13

ATF4

13

G (0.31)

9

ATF4

rs7589621

G

27

10

Nkx2、Nkx3 Pou2f2

GMEB2, Nkx2-3

(0.25)

11

Nkx2、Nkx3 Pou2f2

GMEB2, Nkx2-3

脂肪酶

rs2246833

C

5

3.

ZNF143

ZNF143

CTCF

14

T (0.42)

1

CTCF

rs1412444

C

13

5

Ets1, FEV

ELK1、ELK4 Ets1, FEV FLI1 GABPA

T (0.42)

12

FEV

ELK1 ELK4, FEV、FLI1 GABPA

STAT4

rs11889341

C

7

3.

15

T (0.34)

15

Foxo1

rs8179673

T

8

9

袜,Arid3a真沸点

福克斯,袜,真沸点

C (0.26)

15

HNF1, HNF4, Sox, TBP

福克斯,袜,真沸点

rs7572482

一个

4

8

Pou5f1, Sox2

Pou5f1

EBF1

G (0.47)

4

TBXA2R

rs2238633

G

2

2

Klf4

26

T (0.22)

2

Klf4

rs2238634

G

1

0

ZFX

T (0.22)

5

HNF4, ZFX

HNF4

rs4523

T

5

4

Ets1, GR

C (0.20)

5

Ets1

VEGFA

rs699947

C

2

3.

Tcfcp2l1

16日,18 - 20

(0.17)

1

Tcfcp2l1

rs79469752

C

1

3.

Pax5

Pax5

T (0.05)

6

Pax5

Pax5

rs13207351

G

1

1

Nrf1

Nrf1

(0.31)

2

Nrf1

Pax5

Nrf1, Pax5

rs28357093

一个

1

2

Nrf1

E2F6

E2F6

C (0.1)

2

Nrf1

rs1570360

G

5

3.

EGR1, SP1

(0.09)

6

SP1

rs2010963

C

1

3.

IRF1

G (0.43)

1