文本


看看最近的文章

组学:人类健康保健的前景与展望

Nawin Mishra

美国南卡罗来纳大学哥伦比亚分校生物系

DOI: 10.15761 / IMM.1000258

文章
条信息
作者信息
图表和数据

简介

遗传学的进步导致了组学和系统生物学的发展。它们为更好地了解人类疾病和开发新药以及最终实现个性化医疗提供了工具。由于通量技术和生物信息学的出现,现在有可能确定任何生物体基因组的整个DNA序列以及蛋白质组的整个蛋白质序列。

因此,了解DNA和蛋白质在维持人类健康方面是非常重要的。基因可以制造蛋白质,蛋白质可以催化生化反应,控制生物的表型,这一研究成果为因基因缺陷而无法产生胰岛素的糖尿病患者提供胰岛素,为苯丙酮尿症等精神障碍患者控制某些氨基酸的摄入,以及治疗其他几种人类疾病等医学疾病提供了治疗性管理。

除了催化代谢反应,蛋白质也很重要。因为它们也被用作治疗许多疾病的药物。此外,一些药物与蛋白质相互作用,决定了药物的有效性和副作用。因此,对DNA的理解可以确定导致疾病和药物相互作用的基因和蛋白质

鉴于这些事实,基因组学、蛋白质组学、表观基因组学和代谢组学等组学科学的发展对于了解疾病的原因和治疗以及维护人类健康变得非常重要。基因制造蛋白质,催化生物化学反应,控制生物表型,这一事实的认识,使糖尿病患者获得胰岛素或对苯丙酮尿症等精神障碍患者控制某些氨基酸的摄入等医疗治疗方法得以出现,并治疗了其他几种人类疾病。

现在开发了一些方法,可以在几个小时内以经济有效的方式破译一个人的整个基因组序列:这可以用来发现导致疾病的缺陷基因的性质;这为基因组医学的发展铺平了道路。1941年Beadle和Tatum建立了基因和蛋白质之间的关系,1950年Edman开发了蛋白质中氨基酸的测序方法后,蛋白质的结构和功能得以分析。

蛋白质组学的一些方面,包括不同基因、生化和通量技术的发展,以及未来的医学可能性,到目前为止已经非常成熟。

Hans Winkler在1920年创造了术语基因组,包括生物体的单倍体染色体补体,在20世纪70年代中期MCKussic和Ruddle引入了术语基因组起源于基因组[1]。后来,蛋白质组被引入,以包括生物体的全部蛋白质结构,蛋白质组学一词就是由蛋白质组演化而来的。然而,诺贝尔奖得主约书亚·莱德伯格(Joshua Lederberg, 2000)认为组学一词起源于梵文Om它包含了一个系统或宇宙的完整描述。

组学包括以下内容:

基因组学(完整的核苷酸序列,即有机体的基因组成)

蛋白质组学(任何生物细胞的完整蛋白质)

Epi-genomics(生物体中核苷酸的修饰)

代谢组学(基因活性对代谢物的反应变化)

后来,莱德伯格创造了“微生物组”一词来描述存在于我们肠道和其他动物肠道中的微生物。宏基因组学是微生物组的基因组学。最近的研究结果揭示了微生物组的重要性,微生物组的某些变化可能导致帕金森病主要症状的运动功能丧失。

在这个列表中,可能会添加一些其他类型的组学,如转录组学、交互组学和宏基因组学。转录组学包括转录本的描述;交互组学包括描述蛋白质之间的相互作用,宏基因组学包括我们体内或其他生物体内微生物的基因组学。

导致组学科学出现的生物学的主要进展包括以下几个方面。这些进步整合了生物学的不同分支,并将生物学与化学和其他科学分支相互联系起来。这些进步包括:

1.孟德尔遗传定律:这一定律确立了基因的微粒性质。

2.Beadle & Tatum的一种基因一种酶概念:这一概念通过生物化学反应的遗传控制将基因(DNA)与蛋白质和生物学与化学相互联系。

3.沃森和克里克DNA结构:提供了生命的分子基础和机制:DNA复制,遗传信息的转移(遗传密码,转录和翻译)和遗传信息的变化(突变)。

4.不同技术的发展,包括重组DNA技术/克隆、蛋白质和DNA测序、PCR和通量技术;基因编辑/ CRISPR和生物信息学。

组学的不同分支

基因组学也就是说,基因克隆技术的发展,聚合酶链式反应(PCR)扩增技术的发展,桑格法DNA碱基对测序技术的发展,以及对通量法的进一步修改和适应,以及生物信息学方法对DNA序列的组装和注释成为可能。

因此可以对生物体的整个DNA进行测序,这被称为全基因组序列(WGS),或者在只对生物体的一部分(只包括蛋白质编码序列)进行测序后,可以获得生物体的DNA序列:这种方法被称为外泌体基因组测序(EGS)。EGS更快,更便宜,尽管不是很准确。

大量生物的基因组大小现已确定;其中一些列在(表1)中。基因组测序的成本已经从本世纪初的第一次人类基因组测序的30亿美元大幅下降到2016年目前的约3000美元。DNA测序的成本预计将进一步降至1000美元左右。这种即时测序成本将使其成为常规诊断工具,就像MRI等其他诊断技术一样。DNA测序的常规应用将推动个人医疗的发展。现在利用现有的技术,可以对单个细胞的DNA进行测序:这将对癌症基因组学非常有帮助。

表1。不同生物的基因组学

生物

一年

大小

评论

fx174病毒

1977

3 Kb

第一个被测序的细菌病毒,不是自由生命的有机体

嗜血杆菌influenze

1995

1.8 Mb

第一个被测序的细菌或自由生物

Sachcaromyces酵母

1996

12 Mb

酵母,第一个被测序的真核生物

Ceonoribditis线虫

1998

100 Mb

土壤线虫

黑腹果蝇

2000

180 Mb

果蝇

人类

2000

3000 Mb

人类基因组序列初稿公布

Chimpanze

2005

3000 Mb

人类最亲密的亲戚

*尼安德特人

2006

3000 Mb

已经灭绝的人类表亲,2006年有超过100万个碱基对测序,但现在已经完全测序。

(经John Wiley & sons许可,源自Mishra 2010)

*尼安德特人是与人类关系最近的灵长类动物。人类HAR基因是人类基因组中经历了快速突变的DNA片段,这就是为什么它们被称为人类加速区。

利用目前的DNA测序已经建立了上千种生物的基因组序列。这些基因组序列的知识在很多方面都很有用。这使我们认识到,维持细菌生命的最低基因数量只有260个。这也使人们惊奇地了解到人类只携带23000个基因,而之前的猜测是人类可能有多达10万个基因。如此少的23000个基因的建立强调了RNA加工在每个基因生成多个mRNA中的作用。比较来自不同个体的人类基因组序列,导致拷贝数变异(CNV)与超过1000万个单核苷酸多态性(SNP)的建立。

DNA序列知识是理解人类的基础

对人类DNA序列的了解及其与其他生物的比较,特别是与包括尼安德特人在内的灵长类动物的比较,很明显,至少有几个基因的存在使我们成为人类,并将人类与包括尼安德特人在内的其他物种区分开来。在人类中,至少有6个基因或DNA序列,包括:控制大脑皮层发育的Har1,赋予人类语言能力的FoxP2,负责淀粉消化的Amy1和控制人类大脑大小的ASPM序列,在人类进化的过程中,ASPM的大小增加了两倍。此外,DNA序列LCT提供了消化糖和使用动物奶作为额外食物来源的能力,DNA序列HAR2允许手腕和拇指的灵活性和使用复杂的工具。

DNA序列知识也为理解代谢途径和遗传疾病提供了基础:最重要的是,为合成遗传学/生物学的到来奠定了基础。合成遗传学之所以成为可能,是因为我们有能力编辑DNA序列。编辑或操纵DNA序列有几种方法,其中最快速的方法是使用CRISP方法,该方法允许在DNA的特定位置引入特定的变化

蛋白质组学

蛋白质组学是关于蛋白质,它们的结构,功能和相互作用,DNA通过它们控制任何生物体中细胞的特征。只有少数基因或DNA序列被转录和翻译成蛋白质。其他一些DNA序列被转录和/或然后翻译成产物,促进基因的转录和转录成蛋白质的翻译。

蛋白质通过促进所有的生化反应来控制细胞的结构和功能。此外,随着人体中大量蛋白质作为药物或与药物相互作用,蛋白质在药物设计中的意义变得更加重要。不同种类的蛋白质列于(表2)。

表2。不同蛋白质的功能

S.NO

函数

蛋白质

1

催化剂

酶(超过90%的蛋白质)催化细胞内的生化反应

2

运输

血红蛋白(氧气载体)白蛋白(激素载体)

3.

结构

软骨/骨蛋白

4

细胞骨架

肌动蛋白,Fibrinoactin

5

激素

胰岛素、生长激素

6

抗体

免疫球蛋白

7

抗原和过敏原

细菌和病毒蛋白质

8

移动/肌肉运动

肌凝蛋白

9

受体

胆固醇受体

10

细胞通信/信号

转导蛋白,连接蛋白

(经John Wiley & Sons授权,源自Mishra 2010)

蛋白质组学最初是基于一基因一酶的概念对蛋白质进行功能分析,即突变或患病生物体必须具有与缺陷基因或DNA序列相对应的缺陷或缺失的蛋白质

蛋白质组学首先从一基因一酶的概念出发,对蛋白质进行功能分析,突变或患病的生物体必须具有与缺陷基因或DNA序列[2]相对应的缺陷蛋白或缺失蛋白,如下图所示,镰状细胞性贫血患者的血红蛋白。

1 2 3 4 5 6 7 8

血红蛋白A val - his -leu- thrr - pr0 -Glu-Glu-Lys -

血红蛋白S val - his - leu - thrr - pr0 -瓦尔-Glu-lys -

20世纪50年代初,开始了蛋白质组学的研究,并采用Edman降解法对蛋白质进行结构分析。因此,前者提供了分析蛋白质功能的工具,而Edman的方法通过确定肽中氨基酸的序列来提供蛋白质的结构。

后来的蛋白质组学包括通过通量方法(如2d凝胶和质谱)对单个蛋白质的结构进行化学分析,本节稍后将介绍。

蛋白质结构

蛋白质是一组氨基酸,其中相邻的氨基酸由肽键连接在一起。每个蛋白质都有一个n端和c端,对应于该蛋白质翻译出的基因核苷酸序列中核苷酸的5 '端和3 '端。大多数蛋白质在N端有一段10-15个氨基酸,称为信号肽,它引导每个蛋白质到达最终目的地或位置:例如,一些蛋白质留在细胞内或不同的细胞器中,而其他蛋白质则被排出到细胞外部(图1)。

图1所示。蛋白质结构(由NGHRI的Derryl Leza提供)

一个蛋白质可以有四个层次的结构。这些被称为一级、二级、三级和四级结构或蛋白质的组织水平,如图2所示,由NGHRI的Derryl Leza提供。蛋白质的结构和功能是由洛克菲勒大学的斯坦福·摩尔、威廉·斯坦因、布鲁斯·梅里菲尔德和冈特·布洛贝尔[3,4]等几个生物化学家的工作,以及因获得诺贝尔奖而获得诺贝尔奖的美国国家卫生研究所的克里斯汀·安芬森阐明的。在更早的时候,基因和蛋白质在控制代谢作用方面的关系是由诺贝尔奖得主乔治·比德尔和爱德华·塔图姆建立的。蛋白质结构发生变形的过程称为变性,而蛋白质保持原有结构的相反过程称为复性。现在已知蛋白质变性或再变性的方法:例如,煮熟的鸡蛋可以再变性,使其变成未煮熟的鸡蛋。

图2。苯丙氨酸在人体内的代谢

了解蛋白质及其与基因的相关性。一基因一酶的概念为理解Gorrod关于代谢先天错误的观点提供了生化基础。它还通过比较正常和患者的缺陷蛋白来检测代谢途径及其遗传控制。到目前为止,Beadle和Tatum的这种方法每次都被用于这种分析。

人类疾病的遗传基础由苯丙氨酸代谢在人类中引起精神障碍和其他几种疾病,如下面代谢流程图的括号所示(图2)。

通过对该基因及其编码蛋白质结构的了解,建立了基因与蛋白质的共线性关系。共线性表明,如果一个基因的密码子中的一个核苷酸发生改变,那么crassa神经孢子菌[6]的蛋白质色氨酸合成酶中的氨基酸一定会发生相应的变化(图2)。

蛋白质中氨基酸序列的化学分析用Edman降解法从n端去除一个氨基酸得到蛋白质的整个序列。

瑞典科学家Pehr Edman[7]在访问洛克菲勒大学时,在20世纪50年代初发明了一种方法,从n端开始逐个对氨基酸进行测序。在这种方法中,n端氨基酸用显色化学物质标记,苯-异硫氰酸酯,然后对肽进行轻度水解,释放出标记的n端氨基酸,随后在色谱分离后进行识别,并在已经缩短的肽中标记n端氨基酸,重复其轻度水解,直到肽中所有氨基酸按顺序被识别,如下图所示。这个过程被称为艾德曼退化。这一过程后来由澳大利亚悉尼的Edman公司完全自动化。英国sanger于20世纪60年代中期使用Edman降解法测定了胰岛素中两个肽链的整个氨基酸序列。不久之后,美国的Moore和Stein利用Edmans降解法对第一个大蛋白质核糖核酸酶进行了测序。

N′-氨基酸1-氨基酸2-氨基酸3-氨基酸4-氨基酸5- C′

+异硫辛酸苯酯

温和的水解

苯-异硫辛酸-N ' -氨基酸1 + N '氨基酸2-氨基酸3 -氨基酸4 -氨基酸5- c '

蛋白质组学随着Throughput技术的发展而蓬勃发展,例如:

A. 2D凝胶电泳

B.质谱分析。

2D凝胶电泳:O 'Farrel[8]和Klose[9]同时独立地开发了一种可以在一个凝胶上分离数百种蛋白质的二维凝胶电泳方法。O’farrel研究表明,从大肠杆菌细胞提取物中提取的1100多种蛋白质可以通过电泳和显像在一个凝胶上连续分离,这些蛋白质首先在含氨酚的凝胶上按电荷量分离,然后在含脱酰硫酸钠的凝胶上按质量分离。这种二维凝胶(2D gel)现在被常规用于一次性从任何细胞/组织或生物中分离大量蛋白质。这种2D凝胶还用于比较正常细胞与患有特定疾病的患者细胞的蛋白质谱。

通过在二维凝胶上比较蛋白质结构,可以很容易地确定导致疾病的蛋白质,然后进一步表征以揭示患者蛋白质的分子变化。下图是阿尔茨海默病患者脑脊液中蛋白质的对比。阿尔茨海默病患者中改变的蛋白质是通过其流动性和强度的变化来识别的(图3和4)。

图3。DNA与蛋白质序列的共线性

图4。正常和阿尔茨海默病患者脊髓液蛋白质的2D凝胶分离(由特拉华大学Kevin Lee教授提供)

质谱:质谱仪(MS)是一种非常复杂的仪器,从JJ那天开始经过几十年的发展。汤姆森,粒子物理学之父[10]。质谱仪的发展涉及大量物理学家、工程师和其他技术人员;他们中的一些人因为他们的贡献被授予诺贝尔奖。Fenn[11,12]开发了电喷雾电离法(electrospray Ionization, ESI), Tanaka[13]开发了MALDI电离法并获得诺贝尔奖,这些方法适用于质谱分析包括蛋白质在内的生物材料。感兴趣的蛋白质被质谱进一步表征,通过其氨基酸序列来识别蛋白质,并确定来自正常个体和患者或突变体的蛋白质之间的任何分子变化。通常情况下,从2d凝胶中分离出感兴趣的蛋白质,然后由胰蛋白酶或其他蛋白水解酶消化。

这些片段通过电泳或色谱进一步分离,然后加载到质谱仪的平台上。

这些被电离(通过EPI或最好是通过MALDI)和碎片化,然后在质谱仪的探测设备上进行检测。蛋白质/肽片段的质量在质谱中由片段到达检测器所花费的时间来确定;这个时间被称为飞行时间或TOF:与质量较大的碎片相比,质量较小的碎片到达探测器的时间要短得多。TOF值是一个很好的碎片质量指标;它们的大小,即这些片段是否包含一个或多个氨基酸,以及这些片段组成的氨基酸的性质,见下表(表1)(图5)。

图5。多肽的MS表征和鉴定(基于Mishra 2010, John Wiley and Sons许可)

蛋白质组学作为分化的基础:分化是一种生物中产生不同蛋白质的不同基因组表达的结果,如下所示,蛾子从幼虫发育(图6和图7)。

图6。蛾的幼虫和成虫阶段(Richard Vogt教授提供)

图7。幼虫(绿色)和成虫蛋白质的差异表达(经John Wiley & Sons许可,源自Mishra 2010)

基于蛋白质相互作用的生物复杂性(相互作用组学):很长一段时间以来,人们都知道生物体中DNA的数量并不决定其复杂性,如表1所示。然而,现在已经很明显的是,生物体中蛋白质相互作用的数量决定了生物体的复杂性,如下表3所示。该表中的数据表明,即使水稻基因组大小是该表中所列生物中最大的,但它远没有人类复杂,人类的基因组大小比水稻小得多,但蛋白质-蛋白质相互作用的数量要多得多。此外,本表中的数据表明,有机体的复杂性与任何特定生物体中蛋白质-蛋白质相互作用的数量有关(表3,4)。

表3。估计不同生物体中蛋白质相互作用的数量

生物基因(#)

蛋白质相互作用数量

大米

37000

人类(23000)

650000年

虫(19000)

~ 200000

果蝇(14000只)

65000年

表4。FDA批准作为人类疾病生物标志物的蛋白质列表。

标记

疾病

东航

恶性胸腔积液

她/ neu

第四期乳腺癌

膀胱肿瘤抗原

尿路上皮细胞癌

Thyro-globulin

甲状腺癌转移

α胎蛋白

肝细胞癌

PSA

前列腺癌

CA 125

非小细胞癌

CA 19.9

胰腺癌

CA 15.3

乳腺癌

瘦素,催乳素,骨桥蛋白,胰岛素,类生长因子II

卵巢癌

肌钙蛋白

心肌违规

b型利钠肽

充血性心力衰竭

(数据见表4,Polanski and Leigh Anderson (2006))

*数据基于Stumpf等人的统计估计(2008)。

Diseasome概念:对基因组学和蛋白质组学的理解阐明了疾病与基因和蛋白质之间的关系,并导致Marc Vidal (Goh et. Al 2007)[14]在哈佛大学建立了疾病的概念。它将疾病基因组(基因)与疾病表型(遗传障碍)之间的关系描述为网络。疾病显示了一种疾病是如何由一个基因和一个蛋白质或几个基因和几个蛋白质控制的。下图以图形方式显示了这一点(图8)。

图8。人类疾病和基因网络(源自Goh等人,2007年获得美国国家科学院院刊的许可)

蛋白质作为人类疾病的生物标志物

事实上,有缺陷的蛋白质可以导致一种疾病,特定于一种疾病的蛋白质可以用作一种疾病的标记物。这种蛋白质被称为这种疾病的生物标志物。这种生物标记物的鉴定可用于筛选个人,这可用于疾病的检测和治疗。前列腺特异性抗原(PSA)或前列腺血清抗原(PSA)在前列腺癌发生前监测个体是有用的。其中包括一些生物标志物的列表。

由于对使用特定的单一蛋白质作为疾病的生物标志物缺乏信心,导致开发了一组蛋白质作为某些疾病的生物标志物,而不是单一蛋白质。

研究表明,瘦素、催乳素、骨桥蛋白和胰岛素样生长因子II等四种蛋白质组合的增加是卵巢癌的良好指标。

当这些蛋白质单独出现数量增加时,它们都不能作为生物标志物。

个性化医疗的可能性

基因组学和蛋白质组学的进步为个性化医疗提供了可能,这种医疗将使用基于个体遗传特征的特定药物来治疗疾病:这与目前的医学方法不同,后者是一刀切的方法。例如,目前的癌症治疗

总是包括手术,放疗和化疗。

治疗方法:某些疾病的更好的或特定的治疗方法,可能演变为个性化医疗:

癌症:目前,治疗癌症的特殊药物正在研发中。这些特定的药物包括

特殊药物-他莫西芬,格列卫,赫赛汀,芳香酶抑制剂爱必妥。

此外,基因组学和蛋白质组学可以预测更好的药物反应。癌症患者代谢他莫昔芬的方式不同,例如他莫昔芬可以分几个步骤转化为具有抗癌能力的内源性昔芬。该转化酶在人体内由2D6基因编码,因此2D6基因突变的患者不能从他莫昔芬中获益。现在已经证明,吉非替尼,一种酪氨酸激酶EGFR抑制剂,对亚洲人的肺癌更有效。赫赛汀仅对HER-2突变患者有效

心血管疾病:对病人基因组成的了解导致了处方的剂量

华法令,一种血液稀释剂。

肥胖:版权归OAT所有。肌细胞版权所有:燃烧脂肪的棕色细胞产生2锌指蛋白PRDM / C-CRB β和控制脂肪储存的白细胞。

药物设计:基因组学、蛋白质组学、结构生物学(x射线、核磁共振)和生物信息学的研究已用于药物设计。

代谢组学:组学的这一分支描述了代谢产物或营养物质在任何生物体中控制基因表达的作用。代谢物有不同的来源:例如,首先是有机体在代谢活动过程中产生的代谢物,例如,在人体均质酸中苯丙氨酸的分解过程中产生的代谢物,如果不进一步代谢,就会导致尿尿症,这是一种尿液变黑的精神障碍。其次,我们的营养素,如苯丙氨酸,会导致某些缺乏或拥有缺陷基因的人精神障碍。这就是为什么所有刚出生的孩子都要接受苯丙酮尿症筛查,如果发现苯丙酮尿症阳性,就在8-10岁之前限制饮食中某些氨基酸的摄入,以防止在发育早期损害大脑发育。

第三,能够影响我们基因的代谢物是驻留在我们体内的微生物产生的化学物质,即宏基因组的活动。

在不同的组学中,我们更容易体验到代谢组学的影响,因为我们意识到某些营养物质会导致健康问题,例如,摄入麸质会导致某些人出现严重问题,糖尿病患者摄入糖或某些人摄入乳糖牛奶也是如此。最重要的是,在人类身上进行代谢研究要容易得多,因为只有大约10000种代谢物,而有23000个基因和超过100000个蛋白质。

表观基因组学:表观遗传学这个术语是康拉德·沃丁顿在1912年创造的,它包括了在基因型没有任何变化的情况下,表现型的变化。

沃丁顿对胚胎发生很感兴趣,他发现在较高温度下饲养的果蝇幼虫会发育成没有翅膀的果蝇:然而,这些没有翅膀的果蝇在正常温度下饲养时,会产生正常的有翅膀的后代。这些结果使他得出了胚胎发生过程中环境对基因表达的影响。后来他发现,环境线索可以操纵基因的表达,甚至在一个有机体的成年生活。

表观遗传学里程碑式的实验是由杜克大学的Jirtle和Waterland[15]完成的。在他们的实验中,他们表明,通过改变怀孕刺豚鼠的饮食,刺豚鼠妈妈的幼崽可以抑制小鼠体内刺豚鼠基因的表达。刺鼠基因赋予老鼠黄色,也使它们肥胖,容易患癌症和糖尿病。Jirtle和Waterland发现,雌性刺豚鼠在怀孕前和怀孕后被喂食富含维生素12、叶酸、胆碱和甜菜碱等补充剂的食物,雌性刺豚鼠能生出正常的幼犬,这些幼犬不肥胖或瘦弱,颜色为棕色。然而,这些幼崽在没有任何补充的正常饮食下产生刺鼠后代,这表明它们的基因型没有改变,只是沉默了。后来,研究表明,这些补充剂是甲基基团的丰富提供者,并因刺鼠基因的重度甲基化而导致基因沉默。

类似的实验已经在大鼠甚至人类身上进行,以检验通过甲基化使基因沉默的影响。这些实验是由麦吉尔大学的曼利和斯齐夫进行的。这些实验考察了大鼠的社会行为。研究中使用了两种不同的母鼠,一种是细心的母鼠,它在幼鼠出生后像爱母亲一样耐心地舔舐幼鼠;这些幼崽长大后非常冷静,很好地处理了紧张的情况,而另一种粗心的妈妈忽视了幼崽,根本不舔它们;在没有触觉体验的情况下,这些幼崽成长为非常紧张的突击者,在压力下更喜欢把自己隔离在黑暗的角落里。

在进一步的调查中发现,有爱的妈妈的触觉经验的幼崽海马发育良好,释放的压力激素和甲基化水平非常低的皮质醇很少。而另一种缺乏来自母亲的触觉经验、具有紧张倾向的幼崽海马发育非常差,海马细胞中存在大量DNA甲基化。基于这些结果,Manley和Szyf提出甲基化在大鼠社会行为中的作用。另一项研究进一步证实了这一结论,即不细心母亲的幼崽在大脑被注射后变得与细心母亲的幼崽一样平静

使用曲古霉素A,一种已知的去除甲基的药物。值得一提的是,曲古霉素A在化学性质上与医生用于某些人类患者的情绪稳定剂丙戊酸钠非常相似。

后来,曼利和他的合作者试图将他们的研究扩展到人类身上,尽管在人类身上进行这种实验不仅困难而且不可能。他们选择了两组受试者,一组与母亲关系良好,另一组与母亲关系不好。这两组老鼠相当于细心妈妈和不细心妈妈的幼鼠。他们比较了两组人大脑的核磁共振成像扫描,发现两组人的大脑结构有显著不同。这些研究结果表明,良好的母性和不良的母性会导致人类大脑结构的差异,从而导致对行为的控制。

通常,这种由于DNA甲基化引起的表观遗传变化在卵子和精子形成过程中被消灭。然而,有时这种表观遗传差异可以传递给几代人。表观遗传变化是由染色体中的甲基化DNA带来的。众所周知,X和Y染色体上某些表观遗传位点的甲基化会导致不同类型的人类综合征,包括智力迟钝。某些基因的甲基化可导致人类癌症。鉴于这一事实,美国FDA已批准使用5 '氮杂胞苷治疗某些癌症患者。此外,叶酸已被FDA批准为孕妇膳食中的补充剂,以预防脊柱裂。

组学科学的未来组学,特别是基因组学和蛋白质组学的进步,除了对多种复杂疾病的理解和药物设计外,将为个性化医疗带来广阔的前景。下面总结其中一些。

1.蛋白质组学的未来在于它能够为人类疾病设计更好的药物。相信蛋白质组学将为药物的诊断、治疗和疗效监测提供更好的手段。利用正常人和病人蛋白质组学分析中揭示的生物标志物,有望设计出更好的诊断方法和智能药物。

通过比较正常细胞和患者细胞的蛋白质组,鉴定蛋白质生物标志物及其修饰和改变的代谢途径,将被用于设计智能药物。

蛋白质组学有望通过增加用于药物设计的靶蛋白数量来降低成本。

代谢途径和蛋白质相互作用的知识以及生物信息学工具将被用于促进以具有成本效益的方式开发药物。这将借助于组合化学和数据库中可用的化学品库。由于大多数蛋白质在被蛋白激酶磷酸化后工作,它们的作用可以被激酶抑制剂控制;激酶抑制剂的研究本身已经成为一个领域。

蛋白质组学也将导致新的蛋白质药物的发现。加州大学圣地亚哥分校的Mark Tuszynski[16]和他的团队(2001,2011)最近的研究表明了这种可能性。在那里,研究人员已经证明,阿尔茨海默病的症状,如记忆丧失、脑细胞退化和认知障碍,可以通过向小鼠、恒河猴和其他模型动物注射脑源性神经营养因子(BDNF),一种蛋白质来克服。BDNF蛋白通常在正常动物的大脑中产生,但在患有疾病的动物中,由皮层产生的BDNF蛋白缺失。除了药物的开发,蛋白质组学有望在未来帮助疫苗的生产。

在欢迎信托桑格[17-19]研究所和爱丁堡大学Seth Grant教授的领导下,科学家们研究了人类大脑样本,分离出了一组导致130多种脑部疾病的蛋白质。大脑是我们身体中最复杂的器官,包含数百万个神经细胞,由数十亿个突触连接。每个突触都有一组蛋白质,这些蛋白质结合在一起,建立了一个称为突触后密度(PSD)[20]的分子机器。Seth Grant教授和他的团队已经从接受脑部手术的患者的突触中提取了psd,并使用蛋白质组学的方法发现了它们的分子成分。他们在人类突触中发现了1461种蛋白质,每一种蛋白质都由不同的基因编码。

这些疾病包括常见的使人衰弱的疾病,如阿尔茨海默病、帕金森病和其他神经退行性疾病,以及癫痫和儿童发育疾病,包括各种形式的自闭症和学习障碍。

我们的困境:对组学的理解有一定的哲学基础。几个世纪以来,我们一直认为我们的命运在星星中,随着DNA的出现,我们开始认为我们的命运在基因中,这就抛弃了自由意志的概念。然而,随着表观遗传学的理解,我们开始认为我们的命运并不完全取决于基因,但也有一定的窗口,基因的表达可以通过控制基因的甲基化模式来控制;这毕竟为我们的哲学家和社会思想家所延续的自由意志的思想提供了一些空间。组学提供了一种可能,将基因工程与社会工程联系起来,导致许多伦理困境。

由于组学科学的进步,我们面临的一些困境,例如通过基因工程重新设计我们的基因组的可能性,或者通过改变甲基化模式来控制我们的行为或社会工程,与毕加索在20世纪30年代的著名画作中描绘的镜子前的女孩非常相似。

确认

这篇文章是为了纪念我在麦克马斯特大学的博士生导师和导师Steven f.h. Threlkeld教授。作者希望感谢迈克尔·费尔德教授,马蒂·昂格尔和凯伦·昂格尔在这项工作中的支持。

参考文献

  1. Lederberg J (2001) Ome sweet Ome -一个词汇的家谱宝库。科学家15,8 Anfinsin C.B. 1973控制蛋白质链折叠的原理。科学181:223。
  2. Beadle GW, Tatum EL(1941)神经孢子菌生化反应的遗传控制。美国国家科学院学报27:499-506。
  3. 梅里菲尔德RB(1963)固相多肽合成I四肽的合成。美国化学杂志85:2149-2154。
  4. Gunter B(1999)诺贝尔奖演讲:蛋白质靶向。https://www.nobelprize.org/nobel_prizes/medicine/laureates/1999/blobel-lecture.html
  5. 高罗德AE(1909)代谢先天误差牛津,英国,牛津大学出版社。
  6. Yanofsky C(2005)使用色氨酸代谢的研究来回答基本的生物学问题。生物化学278: 19859 - 10878。
  7. Edman P(1950)多肽中氨基酸序列的方法。化学学报4:283-284。
  8. O 'Farrell PH(1975)蛋白质的高分辨率二维电泳。生物化学250: 4007 - 4021。
  9. Klose J(1975)结合电泳和电聚焦技术在小鼠组织中的蛋白质定位。Humangenetik26日:231 - 243。
  10. Mishra NC(2010)蛋白质组学介绍:原理和应用。约翰·威利父子,纽约1-200。
  11. 芬JB,曼M,孟CK,黄淑芬,Whitehouse CM(1989)电喷雾电离法用于生物大分子质谱分析。科学246: 64 - 71。(Crossref)
  12. Fenn JB(2002)分子象的电喷雾翅膀。Lex Prix,诺贝尔奖。
  13. H Waki, K Tanaka, Y Ido(1988)用激光电离飞行时间质谱分析m/z100.000蛋白质和聚合物。快速共质谱2:151-153。
  14. 吴琪,郭志强,陈志强,陈志伟,Barabási AL(2007)人类疾病网络。美国国家科学研究院104: 8685 - 8690
  15. Waterland RA, Jirtle JL(2003)转座因子:表观遗传基因调控早期营养效应的靶标。分子生物学杂志23:293-300。
  16. Lu, Mark, a Blesch和Mark Tuszynski(2001)成人中枢神经系统损伤后IGF-I基因传递促进皮质脊髓神经元存活但不再生。比较神经病学杂志436:456-470
  17. 桑格F(1952)蛋白质中氨基酸的排列。Adv蛋白质化学7: 28
  18. Sanger F(1958)胰岛素的化学。诺贝尔演讲7: 544 - 556
  19. Sanger FS, Nicklen, Coulson AR (1977) DNA测序与链终止抑制剂。美国国家科学研究院74: 5463 - 5467
  20. Bayes A(2011)蛋白质组、疾病和突触后密度进化的特征。自然神经科学14:19-21

编辑信息

主编

伊凡痛风
伦敦大学学院

文章类型

评论文章

出版的历史

收稿日期:2016年11月13日
录用日期:2016年12月1日
出版日期:2016年12月05日

版权

©2016 Mishra N.这是一篇根据创作共用署名许可条款发布的开放获取文章,允许在任何媒介上不受限制地使用、分发和复制,前提是注明原作者和来源。

引用

Mishra N(2016)组学科学:人类卫生保健的前景和展望。整合Mol医学3:DOI: 10.15761/ im .1000258。

相应的作者

Nawin Mishra

美国南卡罗来纳大学哥伦比亚分校生物系

图1所示。蛋白质结构(由NGHRI的Derryl Leza提供)

图2。苯丙氨酸在人体内的代谢

图3。DNA与蛋白质序列的共线性

图4。正常和阿尔茨海默病患者脊髓液蛋白质的2D凝胶分离(由特拉华大学Kevin Lee教授提供)

图5。多肽的MS表征和鉴定(基于Mishra 2010, John Wiley and Sons许可)

图6。蛾的幼虫和成虫阶段(Richard Vogt教授提供)

图7。幼虫(绿色)和成虫蛋白质的差异表达(经John Wiley & Sons许可,源自Mishra 2010)

图8。人类疾病和基因网络(源自Goh等人,2007年获得美国国家科学院院刊的许可)

表1。不同生物的基因组学

生物

一年

大小

评论

fx174病毒

1977

3 Kb

第一个被测序的细菌病毒,不是自由生命的有机体

嗜血杆菌influenze

1995

1.8 Mb

第一个被测序的细菌或自由生物

Sachcaromyces酵母

1996

12 Mb

酵母,第一个被测序的真核生物

Ceonoribditis线虫

1998

100 Mb

土壤线虫

黑腹果蝇

2000

180 Mb

果蝇

人类

2000

3000 Mb

人类基因组序列初稿公布

Chimpanze

2005

3000 Mb

人类最亲密的亲戚

*尼安德特人

2006

3000 Mb

已经灭绝的人类表亲,2006年有超过100万个碱基对测序,但现在已经完全测序。

(经John Wiley & sons许可,源自Mishra 2010)

*尼安德特人是与人类关系最近的灵长类动物。人类HAR基因是人类基因组中经历了快速突变的DNA片段,这就是为什么它们被称为人类加速区。

表2。不同蛋白质的功能

S.NO

函数

蛋白质

1

催化剂

酶(超过90%的蛋白质)催化细胞内的生化反应

2

运输

血红蛋白(氧气载体)白蛋白(激素载体)

3.

结构

软骨/骨蛋白

4

细胞骨架

肌动蛋白,Fibrinoactin

5

激素

胰岛素、生长激素

6

抗体

免疫球蛋白

7

抗原和过敏原

细菌和病毒蛋白质

8

移动/肌肉运动

肌凝蛋白

9

受体

胆固醇受体

10

细胞通信/信号

转导蛋白,连接蛋白

(经John Wiley & Sons授权,源自Mishra 2010)

表3。估计不同生物体中蛋白质相互作用的数量

生物基因(#)

蛋白质相互作用数量

大米

37000

人类(23000)

650000年

虫(19000)

~ 200000

果蝇(14000只)

65000年

表4。FDA批准作为人类疾病生物标志物的蛋白质列表。

标记

疾病

东航

恶性胸腔积液

她/ neu

第四期乳腺癌

膀胱肿瘤抗原

尿路上皮细胞癌

Thyro-globulin

甲状腺癌转移

α胎蛋白

肝细胞癌

PSA

前列腺癌

CA 125

非小细胞癌

CA 19.9

胰腺癌

CA 15.3

乳腺癌

瘦素,催乳素,骨桥蛋白,胰岛素,类生长因子II

卵巢癌

肌钙蛋白

心肌违规

b型利钠肽

充血性心力衰竭

(数据见表4,Polanski and Leigh Anderson (2006))

*数据基于Stumpf等人的统计估计(2008)。