什么是雷特综合征《上篇》
2017年12月06日 上海丫丫爸小编鱼二按语:
丫丫爸是新家长,但是绝对的“研究型”家长,之前已经帮大家帮大家翻译过一篇percy医生的演讲PPT,这次又出一大作。太赞了!安爸没耐心把我讲懂的几个问题,仔细学习丫丫爸这篇文章,我算是搞懂了一丢丢。谢谢丫丫爸!妈妈们,学起来!也希望有更多的家长也参与进来,让我们能够对于疾病,对于伴随着疾病的生活有更多的发现,也就有更多的希望。
前言
想必很多雷特家庭都有类似的经历:孩子小时候好好的,和别的小朋友没有什么区别,然后不知道从什么时候就发现孩子越来越“不正常”。带去医院做了各种检查、评估、抽血化验。最后,根据一份基因检测报告,医生得出了最后结论:雷特综合征(Rett Syndrome)。
大多数家长会打开百度百科,查阅的结果是:
“Rett综合征是一种严重影响儿童精神运动发育的疾病,发病率为1/10000-1/15000女孩。临床特征为女孩起病,呈进行性智力下降,孤独症行为,手的失用,刻板动作及共济失调。其病因及遗传方式尚不清楚。”
好吧,其实除了有很多看上去很吓人的描述外,其它基本上什么都没有说。
有一些家长可能会进一步搜索,会看到/学到更多描述,知道“典型/非典型雷特综合征”,知道“MECP2基因”,看到很多雷特研究的进展、康复的指引以及药物治疗的信息。
但是,我们的孩子得的到底是一种什么病,似乎还是没有很清楚。
这一系列文章,希望能够帮助各位新老家长一起探讨,好好的了解一下我们宝宝到底是怎么回事。
希望读完本文,您可以:
大致清楚雷特综合征的发病原因
看懂孩子的基因检测报告
有理性的对于各种治疗药物的期待
不过,您恐怕无法达到下面这些目的:
学会日常的健康护理方式——请查看新家长指引的其它文章
学会康复训练方法——请查看新家长指引的其它文章
掌握基因相关的基础知识——请自学相关理论,一个好地方是网易公开课上的MIT公开课《生物学导论》。
得到治疗或者缓解孩子病情的方法——请理性期待,谨慎参与临床实验,并拒绝各种来历不明的治疗方式。
需要特别说明的是,由于笔者并非生物学专业,因此文中学术上不严谨甚至谬误的地方在所难免。还请大家批评指正,共同讨论。文章中的所有信息均来自于公开发表的论文,在文章末尾会有出处,供感兴趣的家长进一步阅读。所有非学术界的结论都会特别标注出,以示仅供参考,批判接收。
好的,那么我们现在开始吧。
雷特综合征的致病原因
历史回顾
笔者个人认为,迄今为止,雷特综合征的历史上有4个里程碑,分别是1966年、1983年、1999年和2017年。很凑巧,它们之间都是正巧相差16~18年,或许这也是一种天意吧。
谈到雷特综合征(Rett Syndrome,缩写RTT),Andreas Rett和Bengt Hagberg绝对是绕不开的。前者于1966年第一次报道了这种症状,后者于1983年第一次将雷特综合征引入公众视野,并用Andreas Rett的名字命名了这种症状(Rett Syndrome)。此后的一段时间,雷特综合征相关的临床研究开始不断进展,然而其致病原因却始终未能明确。
时间到了1999年,距离Hagberg的文章发布已经过去16年了。一篇《Nature Genetics》上发表的论文[1]突然打破了雷特综合征研究的沉寂,这篇文章从基因的角度揭示(大部分)雷特综合征患者的致病原因是因为MECP2基因的突变。从此,雷特综合征的研究进入了一个新的时代。
当我们往回看时,可能无法理解十几年前将雷特综合征和MECP2基因关联起来到底有多重要。然而这个发现的重要性,不但直接影响了之后雷特综合征的研究,对于其它自闭症谱系疾病和精神发育类型疾病都有非常关键的意义。当然,对于我们雷特孩子家长来说,还有一个影响:就是去医院的时候,雷特综合征的孩子不再去精神科(例如:北医六院郭延庆),而是去神经科(例如:北医一院包新华)那里了。
从神经着手相比从精神着手有什么区别呢?简单的说吧,人们研究自闭症,研究各种治疗方案,首先肯定需要做动物实验吧?然而从哪里去找那么多自闭小白鼠呢?但是当雷特综合征和MECP2基因的关系发现后,人们可以很方便的通过敲除老鼠体内的MECP2基因来制造一堆一堆“雷特鼠”,然后进行研究。甚至在更高级的哺乳动物比如灵长类动物[2]上都能进行研究。
正因为如此,从1999年之后,雷特综合征的病理性和药物治疗的相关研究开始提速。与此同时,进入21世纪后DNA测序技术也在飞速发展,测序成本不断下降,雷特综合征患者的基因型和表型的研究也开始不断进行。如此种种,才有了今天的局面。
从1999年之后,研究者不断尝试在动物上通过各种方式来“治疗”雷特综合征,而这些研究在2017年又有了一个突破性的进展[3],人们成功的对“雷特鼠”进行了基因疗法,可以预期的是未来五到十年,会出现基因疗法应用于人类的临床实验。有关基因疗法的内容,在后面药物和未来一章中会再讨论。
现在,还是让我们把时间倒退到1999年,看看当时的情况。Zoghbi团队是怎样发现MECP2基因和雷特综合征之间的关系的?要知道人体有几万个基因,各种有义无义的突变多如牛毛,加上1999年那个时候人类基因组测序的技术还不至于像今天这样普及且便宜……如此种种,只能有一个可能:Zoghbi团队不是瞎猫碰到死耗子,他们是有的放矢,通过科学的分析,慢慢的锁定猜测MECP2基因是和雷特综合征有关系的。
让我们再把时间倒退5年到1992年。这一年,英国爱丁堡大学的Adrian Bird发现生物体内有一些蛋白质,它们能够与甲基化DNA相结合。Bird发现了一系列这样的蛋白质,并给其中第二个发现的这样的蛋白质起名MeCP2(methyl-CpG binding protein 2)。在后续研究中,他发现MeCP2这个蛋白质很有意思,它能通过和去乙酰化复合物(histone deacetylase complex)作用来抑制基因的表达。1997年,Bird团队在《Cell》上发表了文章[4],向世界介绍他们的研究成果。
与此同时,在美国Baylor医学院,Huda Zoghbi正在带领团队研究一些罕见的遗传病,其中就包含雷特综合征。因为雷特综合征表现出多种不同的症状,让Zoghbi团队猜想,这么多不同且奇怪的症状,或许并不是一个基因的表达失调而是多个基因同时表达失调。这个时候,那个能够影响别的基因表达的MeCP2蛋白质出现在Zoghbi眼前……
这就是那篇1999年发表的论文诞生的背景。需要说明的是,上一段内容非文献记载无实际依据,属于笔者讲八卦故事,无真实性,请大家看看,理解意思就好。
安爸注:Huda Zoghbi是临床医生,Adrian Bird是基础科学家。在2016年12月时,他们因雷特综合征的研究成果共同获得了邵逸夫奖的生命科学与医学奖。在Huda和Bird教授2016年12月在香港领取邵逸夫奖的时候,他们各自做了一个小时的演讲,Huda有讲述她是如何从1983年遇到第一个雷特孩子,然后如何在1999年确认MECP2基因为致病基因。但她没有讲细节,她只是说这可能就是故事的多面性,腾讯上有这个演讲的视频,有兴趣的家长可以去看一看。
那么,Bird和Zoghbi这两个大牛后来又做什么了呢?他们一直在做雷特综合征相关的研究。
Zoghbi团队从临床着手,研究MECP2基因和临床症状的关系。在发现大多数雷特综合征患者是因为MECP2基因变异导致的后,通过多年的研究和病例收集,Zoghbi团队又先后发现了4例有其它精神疾病(比如自闭症、智力障碍等)的患者,她们虽然都有MECP2突变,但是表现和雷特综合征却不一样[5]。这进一步确定了雷特综合征的诊断还是应该以临床诊断结合基因检测共同进行。此外,Zoghbi团队通过基因型和表型之间的研究,发现突变点位跟患者的严重程度存在一定关系,但是关系不大,并由此猜测雷特综合征患者的严重程度主要取决于X染色体失活(XCI)[6]。详细的内容后面有关基因的章节再介绍。
Bird团队从基因着手,进行了大量动物实验。前面提到的在2017年雷特综合征研究的第四个里程碑——小鼠模型上实现的基因疗法,就是Bird团队完成的。详细的内容在药物和未来一章介绍。
到这里,或许细心的读者已经注意到了,前面提到的Bird和Zoghbi的研究对象其实是有一个区别的。Bird研究的是“MeCP2”,Zoghbi研究的是“MECP2”;一个是蛋白质,一个是基因。似乎两个是一样的,但是又好像有区别。因此,我们需要先补补遗传学的理论课,搞清楚基因和蛋白质的区别和关系。
遗传学基础——基因是什么
有关从孟德尔(Mendel)开始直至DNA双螺旋结构发现等等一系列的遗传学故事,这里就不再赘述了,有兴趣的家长可以自行搜索。这里仅仅简要回顾一下目前人类的认识:
1.人体细胞是由细胞核、细胞质、细胞膜等物质构成,其中细胞核中有染色体,人类一共有23对染色体,包括22对常染色体和1对性染色体;
2.染色体是由DNA以及一些其它物质构成的,DNA由两条长链在空间上以双螺旋形态呈现,每条长链是由A(腺嘌呤)、T(胸腺嘧啶)、C(胞嘧啶)、G(鸟嘌呤)四种碱基以各种排列组合构成,两条长链之间,以A对T,C对G的形式进行配对链接;
3.因为DNA这种配对的特性,当DNA双链打开后,任何一条链都能够配对出它的对应链,这也就是为何DNA能够复制的原因;
4.对于DNA的一条长链(其形式诸如“……ATTCGA……”),其上面会有多个片段。这些片段就是基因;
5.在细胞中,DNA上的基因会被转录(transcription)成RNA,称为信使mRNA。然后mRNA被翻译(translation)成蛋白质(Protein),进而最终影响生物的表型。
到这里,大家就应该明白MeCP2蛋白质和MECP2基因的关系了。MECP2基因就是DNA中最终合成人体中MeCP2蛋白质的模板。因此,如果MECP2基因发生了突变,就不可能合成MeCP2蛋白质。而MeCP2蛋白质又非常重要,它不但可以调节其它蛋白质,还可以影响很多别的基因,让别的基因生成更少或更多的别的蛋白质,而那些各种各样的蛋白质又会有各自不同的作用……如此种种,好像一个树一样,从MECP2这个树干会延伸出无数个枝杈。因此,谈到雷特综合征和MECP2基因时,常常有一句话:“幸运的是,雷特综合征是单基因发病,不幸的是,这个基因太复杂了”。
具体有多复杂?下图[7]可以给大家一个MECP2基因有多复杂的直观感受(看不懂/看不清里面的字没关系,只要看清中间那个框里是MECP2,然后知道周边那些个写着黑体大写英文的矩形小框都是其它基因就可以了):
因此,正是因为MECP2基因的复杂性,才导致雷特综合征孩子在认知、沟通、言语、精神、运动以及生长发育等各个方面的障碍。
直观的举个例子,MECP2能够上调BDNF(脑源性神经营养因子,brain derived neurotrophic factor)基因的表达,而BDNF蛋白质对神经元的存活、分化、生长发育起着重要作用。因此,当MECP2基因突变导致无法生成MeCP2蛋白质时,BDNF基因就可能无法生成足够的BDNF蛋白质,进而可能引起各种神经发育问题。
然而,这里有一个问题。可能一些爱思考的家长也发现了:如果说雷特综合征是因为MECP2基因发生突变出了问题导致,那为何同样是MECP2基因突变,每个雷特孩子的情况却各有不同呢?这就需要再仔细探讨一下基因到底是如何影响最终人的表现状况,从而建立起基因型和表型之间的关系。
首先,即便都是MECP2基因突变,但是突变的类型不同,因此表型也会有一定差异;
其次,每一个雷特孩子个体的其它基因也有不同,而部分表型是基于多基因共同作用的结果,因此自然表型也会有一定差异;
最后,表型还会受到后天的环境影响,甚至影响很大。举个通俗的例子,藏族人在青藏高原生活不会有高原反应是因为一个特殊的基因EPAS1发生了突变[22],但是这并不代表其它人群就不能在高原环境生存了,通过慢慢的适应锻炼,大多数人都能在西藏好好玩么……
安爸注:有关基因型、表型和环境的关系,下面这个图是一个很好的示意。从这个角度看,环境的干预也是很重要的,这也是安安雷特一直在探索的,比如康复活动对于疾病表型的影响。
环境的影响或者说康复训练,自身是一个很大的课题。有兴趣的家长可以关注这方面的文章。本文还是注重于讨论基因方面。那么就先从基因表达这个概念说起吧。
基因的表达
在前文回顾的第5步,提到了基因会最终表达(express)蛋白质,这就是基因影响最终人的表现的基础。但是这里的“表达”,其实是一个很复杂的过程,分为好几步。简单的说,就是DNA影响mRNA,然后根据mRNA合成蛋白质。
具体的,可以参看下图(来自英文维基百科中Gene的词条:https://en.wikipedia.org/wiki/Gene):
其中,第一行是DNA,如我们回顾的那样,是由ATCG等碱基排列组合成的一条长链,所有的基因都在上面。每一个基因都有一个启动子(Promoter),来标志着基因表达的开始。启动子之后是一个非翻译区,叫5’非翻译区(5’UTR),之后是基因的内容,再后是另一个非翻译区,叫3’非翻译区(3’UTR)。然后就结束了。顺便提一下,这里面5’和3’的叫法是根据DNA链的方向来的,具体可以参看相关书籍,简单的说,是因为碱基的链接总是从上一个碱基的第3个碳原子链接到下一个碱基的第5个碳原子的位置。
在基因开始表达时,首先细胞中的RNA聚合酶会定位到启动子,然后将之后的DNA片段(也就是基因)转录(transcription)成RNA序列,称为前信使RNA(Pre-mRNA)。这种转录是严格一一对应的,遵循A->U,T->A,C->G,G->C的方式。RNA和DNA的碱基配对是类似的,唯一的一个差别是RNA是U(尿嘧啶)和A(腺嘌呤)配对。经过这样转录,得到的RNA的序列除了U/T的区别外,是和原先DNA长链中配对的另一条DNA长链中的序列完全一样的。因此,通常将被转录的DNA链条相对的另一条DNA链称为编码链(而不是和RNA配对的链),因为另外一条链的内容才和转录得到的RNA一样。
得到前信使RNA后,细胞中的剪切体会将前信使RNA中的部分片段剪除,把剩余的片段拼接,并在后面加上一条多聚A的尾巴。这里面被裁剪掉的基因片段称为内含子(Intron),保留下来的片段称为外显子(Exon)。拼接后的RNA称为成熟的信使RNA,简称信使RNA(mRNA)。
最后,信使RNA通过翻译(translation)的操作合成蛋白质,具体操作是转运RNA(tRNA)完成的。转运RNA一段是3个碱基,可以和mRNA上的碱基配对,另一端是氨基酸。通过各种各样的tRNA操作,mRNA上的每3个碱基就都能对应到1种氨基酸,这些3个碱基的组合就叫做密码子(Codon)。所有按基因顺序构成的这些氨基酸再进一步链接成为多肽,然后在空间中折叠形成最终的蛋白质。
这里有一个小问题:碱基一共4种,密码子作为3个碱基的组合就会有64种(4×4×4)类型,而人体中氨基酸总共才有20种。因此这里面会存在多对一的关系。事实上,除了20种氨基酸外,3个碱基的排列组合还有一种意义,就是表示翻译的结束。因此加上这个表示结束的组合,一共64种排列组合有21种意义,具体如下:
这个表中第一列下面的4行TCAG表示3个碱基中的第1个碱基,然后右边的4大列表示的是第2个碱基,每个大列中的小列表示第3个碱基。举个例子,如果DNA序列是ATGAAGCGC……,那么可以找到ATG对应甲硫氨酸(Met,简称M),AAG对应赖氨酸(Lys,简称K),CGC对应精氨酸(Arg,简称R),等等,这样就可以通过DNA序列找到所有编码的氨基酸了。
这里的内容有点抽象,但这也是我们了解清楚各种基因疾病的基础。对此有兴趣的家长可以搜索一下中心法则和基因表达相关的内容,有一些不错的生物学的教学PPT可供参考。
现在,我们来具体看看MECP2基因。下图是MECP2基因的抽象图[8](严格的说,是小鼠的,但是人的MECP2基因也是类似的,可以参考一下)。从中可以看到,基因上一共有4个外显子:
我们先不管里面MBD/TRD那些是什么意思。总之,里面显示的1/2/3/4就是MECP2基因的4个外显子。成熟mRNA就只包含这些信息,其余的信息都被剪切掉了。而且,正如图上直观的显示,EXON1/EXON2的长度非常短,EXON1含62对碱基,EXON含26对碱基,EXON3稍微长一些,有351对碱基,EXON4最长,有1084对碱基。所有这4个外显子的碱基对加起来,也不过约1500对碱基。而整个MECP2基因有多少个碱基对呢?75000多对。换句话说,MECP2基因中负责翻译成MeCP2蛋白质的信息只占不到2%,有超过98%的信息都藏在那些被剪切掉的内含子中。这些没有用到的信息大部分在EXON2和EXON3中间,这也是为什么图中2和3之间画了两道杠的原因——表示这里真的很长……
有关外显子和内含子,后面再详细解释它们的作用。先再来整理一下整个流程:我们知道了MECP2基因,经过一系列转录翻译的工作,最终得到了能够编码出一个含486个氨基酸的蛋白质,即MeCP2蛋白质。那么,很自然的,MECP2基因到MeCP2蛋白质的过程中,任何一个环节出问题,就会导致最后无法合成MeCP2蛋白质或者合成的过少/过多。其中,比较严重的问题,也是我们雷特综合征孩子出现最多的问题,就是MECP2基因的外显子上发生了突变,这样在翻译过程中就会出现问题,导致无法生成正确的MeCP2蛋白质,进而影响人体的各种功能。
现在,再回头稍微解释一下MBD和TRD的意思。这两个区域对应最终形成的MeCP2蛋白质上的两个功能区。还记得前面提到的Bird发现的MeCP2蛋白质的神奇作用么?Bird团队在对MeCP2蛋白质的研究中,发现MeCP2蛋白质主要起到两个作用。一个是MeCP2蛋白质可以和甲基化CpG结合(从而可以抑制别的基因启动子,调节别的基因表达),这个主要靠蛋白质中靠前一部分的区域,称为MBD(methyl-CpGbinding domain,甲基化CpG结合区),位置从第78个氨基酸开始,到第162个氨基酸结束,共含有85个氨基酸[9]。另一个是MeCP2蛋白质可以抑制基因的转录(从而可以调节别的基因的表达),这个主要靠蛋白质中靠后一部分的区域,称为TRD(transcription repression domain,转录抑制区),位置从第207个氨基酸开始,到第310个氨基酸结束,共含有104个氨基酸[4]。这两个区域的详细作用原理这里就不深究了,大家只要清楚其位置的重要性就好。
原文作者:上海丫丫爸
备注:安爸