解读DNA

破译生命遗传的密码   解读生命的“天书”

首先解读完毕的第22号染色体   人体的第二张解剖图——人类基因组图谱

水稻基因组计划  

破译生命遗传的密码

 常言说:“世界上没有两片完全相同的叶子”。这句话表明了生命体的多样性和差异性,而这种多样性和差异性是由生命体的外部环境与内部因素所决定的。其中,遗传信息在起着极其重要的作用。

  遗传信息和生命物质是多种多样的。DNA是由数十乃至数十亿个核苷酸、磷酸根、碱基组成的生物大分子,在它的不同部位上包含着不同的遗传信息,而这些信息代表着不同的遗传性状指令,由此导致了千姿百态、千差万别、气象万千的生物世界。

  DNA分子双螺旋结构模型表明了遗传物质的结构和遗传信息的复制机制,中心法则揭示了遗传物质如何构建生命物质的一般规律。在它们诞生后,科学家们便试图解读导致大千生物世界的各种遗传信息,探索其中的奥秘。

位于美国纽约长岛的冷泉港,是世界著名的遗传学、分子生物学研究基地与学术交流中心。俄裔美国物理学家伽莫夫(G . Gamov)

20世纪50年代中期,沃森在讲解DNA的双螺旋结构  沃森和克里克于1953年夏在美国冷泉港学术讨论会上作DNA的结构及其遗传含意的报告后,与会的学者们围绕着DNA碱基顺序和蛋白质的氨基酸顺序之间的相互关系展开了热烈讨论,其中心议题是:4种不同的碱基怎样排列组合进行编码才能表达出20种不同的氨基酸。

  第一个提出具体设想的是俄国出生的美国物理学家G·伽莫夫。他认为碱基的不同组合可以决定氨基酸,从排列组合计算,两个碱基组成密码太少,只有42=16种;四个碱基组成密码又太多,有44=256种,三个碱基组成密码有43=64种,比较合适。他进一步推论:一种氨基酸可能有不止一个密码。

 

克里克在1961年同S·布伦纳(Sydney  Brenner  1927—)等人用噬菌体突变体实验研究密码的比例和翻译的机制。实验表明,密码确是以三联体核苷酸的形式代表着20种不同的氨基酸,而且是由一个固定点开始,朝着一个方向一个挨一个地读下去,如果中间有一个核苷酸发生了增或减的差误,以下的密码都会发生变化。巴基斯坦裔美国生物化学家霍拉纳他还提出,很可能密码有同义语,不只一个密码代表着一个氨基酸。这就使原来数学推论的种种可能性找到了实验的根据。

第一个用实验给遗传密码以确切解答的是德裔美国生物化学家M·W·尼伦贝格(1927-)。1961年他和另一位德国科学家马太首先在实验室内发现了苯丙氨酸的密码是RNA上的尿嘧啶,并得到了单一苯丙氨酸组成的多肽长链。1959年诺贝尔生理学或医学奖获得者、西班牙裔美籍生物化学家奥乔亚西班牙裔美籍生物化学家S·奥乔亚(1905-1993)和尼伦贝格分别测定了各种氨基酸的遗传密码。到1963年,20种氨基酸的遗传密码都被测出。而巴基斯坦裔美国生物化学家H·G·霍拉纳(1922~)则在60年代用化学的方法合成了64种可能的遗传密码,并测试了它们的活性。到1969年64种遗传密码的含意全部得到了解答,至此,“遗传密码辞典”问世了。

1968年,尼伦贝格和霍拉纳因在破译遗传密码方面的重要贡献,获得了1968年诺贝尔生理学或医学奖。

RNA领带俱乐部

多年来科学家一直猜测RNA在蛋白质合成过程中扮演了重要角色。为了查清其中的奥秘,1954年,伽莫夫组建了RNA领带俱乐部,目的是要了解RNA是如何参与合成蛋白质的。伽莫夫定购了一批领带在黑色的底面上用丝绸绣着一个RNA符号。俱乐部共有24名成员,其中20名代表氨基酸,4名代表碱基。每人的领带上面都有一个他所代表的氨基酸或碱基的符号。伽莫夫是丙氨酸(符号Ala),克里克是酷氨酸(Tyr),布伦纳是缬氨酸(Val)。俱乐部的成员们就密码和蛋白质合成交换意见。整个50年代里,在伽莫夫、克里克、布伦纳和俱乐部其他成员之间,关于RNA之谜的纯理论猜测的报告、便条和信件绕着地球飞来飞去。

遗传密码的破译,是20世纪生命科学中最令人激动的巨大成就之一,它对生物工程的意义可以和元素周期表在化学上的意义相比。这等于编著了一本生命科学的辞典,而这本辞典适应于从细菌到人类的一切生物。这些生物都是按照这本辞典查阅、和翻译着自己的蛋白质,又按照这本辞典营造和传递着生命。

蛋白质由20种氨基酸不同组合方式构成,蛋白质是一切生命的基础蛋白质结构模型局部

解读生命的“天书”

 美国病毒学家R·杜尔贝科(1914-)1986年3月7日在美国《科学》杂志上发表了一篇题为《癌症研究的转折点——人类基因组的全序列分析》的文章,他指出:“人类DNA序列是人类的真谛,这个世界上发生的一切事情,都与这一序列息息相关。”该文后来被称为“人类基因组计划”的“标书”。

  1989年,美国国立卫生研究院成立了人类染色体研究中心,沃森出任第一任主任。1990年,美国国会批准了“人类基因组计划”,并于10月1日正式启动,由多国科学家参加、被称为“生命科学阿波罗计划”的人类基因组计划正式启动。



沃森说:21世纪是存在于DNA中的生命说明书被解读并受其恩惠的时代。在“人类基因组计划”中,美国人承担了54%的任务。法国免疫学家和医学家、1980年诺贝尔生理学或医学奖得主让·多塞(1916~)以自己的奖金于1983年底建立了人类多态性研究中心。该中心承担了“人类基因组计划”2.8%的测序任务。

“人类基因组计划”的主要任务包括:找出人类DNA上的所有基因(当时估计约10万个,后来证实只有3~3.5万个),确定30亿个碱基对的排列顺序;建立相应的数据库,进行数据分析,并分析此计划可能带来的人种、伦理及社会问题;对一些动物的遗传组成进行研究,包括大肠杆菌,果蝇和小白鼠等。

日本承担了人类基因组计划7%的测序任务。图为日本人类基因组分析中心主任中村佑辅教授。中国是"人类基因组计划"中的唯一发展中国家,负责测定3号染色体上的3000万个碱基对,占人类基因组计划工作量的1%。图为中科院遗传所人类基因组中心主任、人类基因组计划中国协调人杨焕明。

所谓的基因组,指的是生物体内的所有DNA,包括它的基因。人类基因组计划要测定的是人体23对染色体中的所有DNA的序列,它由31.647亿个碱基对组成,共有3万至3.5万个基因。换句话说,生命天书是由30多亿个字写成的,如果将这30多亿字排版到一张报纸上,那么大约需要20万页纸才能排完这部巨著。生命就是一本用DNA语言写成的天书,每一页上都翻来覆去地写着A、T、C、G由此可以想见,读取这部巨著所要耗费的时间将是如何的惊人。如果没有一系列的技术方法作后盾,那么要想读完这部书简直难以想象。

在“人类基因组计划”实施之初,预计要用15年才能完成测序。但由于技术的飞速发展,研究进程不断加快,加上各国科学家和政府的一致努力,整个计划完成的时间一再提前。2001年2月12日,中、美、日、德、法、英等6国科学家和美国塞莱拉公司联合公布了人类基因组图谱及初步分析结果。

小知识:什么是基因测序?

  基因测序是确定DNA双股链上每个独立结构单元或碱基的确切顺序的过程。测序经常被称为“破译”,因为其结果就像解码一样。解码结果包含数百页和成千上万行4种字母的序列。这些字母表示4种不同的碱基,分别用它们的首字母A、T、C、G表示,其排列顺序中蕴藏着各种各样的遗传信息和生命指令。

英国著名化学家桑格(1918-)。他因测定出胰岛素的氨基酸排列顺序获1958年诺贝尔化学奖,又因发明测定DNA序列的方法(即桑格法)获1980年诺贝尔化学奖。美国分子生物学家W·吉尔伯特(1932-)因发明出另一种测定DNA序列的方法,与桑格分享1980年诺贝尔化学奖。美国生物化学家、1993年诺贝尔化学奖得主穆利斯
根据桑格法开发的DNA自动定序机使一周(24小时运转)解读100万甚至几百万个碱基成为可能。它为“人类基因组计划”立下了汗马功劳根据桑格法开发的DNA自动定序机

中华龙鸟化石“他是个很活跃的孩子,常把各种东西混到一起。3岁那年,他把鸡蛋打碎搅成油漆,然后将房子刷成了黄色。我经常发现他几瓶子几瓶子地收集昆虫和蛆。我想他简直疯了。他对一切都入迷。今天我才知道这是因为他的思维太活跃了。”这是PCR的发明者、美国生物化学家K·穆利斯(1944-)的母亲在得知儿子获诺贝尔奖之后说的话。正如他母亲所说的,穆利斯是一个从小就拥有异常活跃的思维、独立不羁的个性和离经叛道精神的人。

有人设想应用PCR法,可以将化石和琥珀中的残留的古代生物的微量DNA进行扩增,从而复制出古代生物 美国科幻电影《侏罗纪公园》就描绘了这样一种可能性  PCR是聚合酶链反应(polymerase chain reaction)的简称,是一种在短时间内使DNA大量扩增的技术,它源于穆利斯1983年回乡下度假途中的一个突发奇想:如果找到一种办法操纵分子复制技术这个环节的话,那么目标DNA不就可以以指数形式扩增了吗?


穆利斯的这一突发奇想对于分子生物学家们来说不啻一个福音,使他们的实验操作程序大为简化,将大量的人力、精力和时间从繁琐的重复性劳动中解放了出来,大大方便了他们对生命的研究。PCR法被称为是“DNA分子的拷贝机”。

如今,PCR技术应用的广泛性有如其本身的原理一般呈指数级增长,早已不再局限于分子生物学领域,它对基础医学、临床医学、人类基因组测序及法医学等领域的贡献都是极其巨大的。

我认为我最重要的成就是开发出测定DNA核苷酸顺序的方法,该法现在正被用来解读人类基因组序列。人类基因组也许是最重要的化学物质,因为它包含了我们人体结构和功能的所有信息。……一本书是由26个字母不同的组合而成,想表达的意思和想传达的信息都包容在这26个字母的顺序中。DNA仅有4个“字母”,即A、G、C、T(当然这些不是真正的字母,而是化学物质),基因的信息就包含在由这4个“字母”按一定顺序组成的序列中……这将是这个新世纪的重要课题,它将导致激动人心的新发现,它给每个有兴趣加入这项带有冒险性的探索、有志于成为科学家的年轻人提供了好机会。
               ——摘自桑格1999年应本展览筹办者之邀写给中国青少年的信

在“人类基因组计划”中发挥重要作用的另一项测序技术是“霰弹法”(也叫“全基因组鸟枪法”或“打机关枪法”)。该技术是先将DNA从细胞核中分离出来,然雄心勃勃的文特尔后利用声波将每条染色体分为极小的片段,一共6000万片,再把每一片插入一台机器人控制的机器,由它进行高速解码,破译的结果传送给超级计算机,由超级计算机把每一片段重新组装成人体的23对染色体。换句话说,霰弹法就象拼图游戏,先将拼图打乱,最后再重新组装起来。霰弹法测序

  这项技术是由美国科学家兼企业家C·文特尔(1946-)在1991年开发的。文特尔1998年组建了塞莱拉公司,亲任公司总裁和首席科技官。文特尔宣称他的新公司将在3年内完成由政府拨巨资资助的“人类基因组计划”试图在15年完成的研究工作!此后,以“人类基因组计划”领导人F·科林斯为首的庞大的官方机构与文特尔领导的私营机构塞莱拉之间展开了科学竞赛,后来由美国总统克林顿出面调解,才使得公私两家合起手来,于2000年6月26日联合宣布成功绘制出人类基因组草图,值得一提的是塞莱拉公司塞莱拉公司实验室里成排的DNA放大器“影印”着分子片段,然后再把它们发往300台DNA分析仪,由后者破译DNA的化学基础序列。最后,分析仪把数据发送到公司的超级计算机。完成这一工作仅用了两年时间!

文特尔被世人看作挑战科学界的叛逆者,因为他一直游离于正统的科学家之外。据文特尔自己述说,他从小就得了一种罕见的疾病,缺乏视觉记忆功能。文特尔勉强获得了高中毕业的文凭。他曾经参加越南战争,回国后进入加利福尼亚大学圣地亚哥分校刻苦攻读生物化学,6年后获得了生理学和药理学博士学位,从此走上科研之路。文特尔特别喜欢出风头,并且常常出言不逊。但他尔并不是一个只会说大话的人,恰恰相反,他在行动上也绝对是一个巨子。文特尔敢于和实力雄厚的“人类基因组计划”叫板,一方面源于他永不美国《科学》杂志封面,它表明了这样一个概念:人类的DNA是一张由6000万片组成的"拼图",那么,整个人应该是一张由多少片组成的拼图呢?服输的性格,另一方面也源于他掌握着了非常强有力的测序技术——霰弹法。

基因芯片(Genechip)是生物芯片(Biochip)技术中发展最成熟和最先实现商品化的产品,除了基因芯片之外,生物芯片还包括蛋白质芯片、芯片实验室等。基因芯片又称DNA芯片或DNA微阵列。它和我们日常所说的计算机芯基因芯片分析组织样本时,可形成点图谱。这些图谱所揭示出的个体差异可能会帮助医生根据每个患者不同的独特需要采取不同的治疗措施。片非常相似,只不过高度集成的不是半导体管,而是成千上万的网格状密集排列的核酸分子(也叫分子探针)。所谓探针,只是一段人工合成的碱基序列,在探针上连接上一些可检测的物质,根据碱基互补的原理,利用探针到基因混合物中识别特定基因。

  与传统基因序列测定技术相比,基因芯片破译人类基因组和检测基因突变的速度要快数千倍,目前,该技术主要应用于基因表达检测、突变检测、基因组多态性分析和基因文库作图以及杂交测序等方面。它的出现给分子生物学、细胞生物学及医学领域带来新的革命,成为后基因时代最重要的基因功能分析技术之一。

首先解读完毕的第22号染色体

1999年12月1日,国际人类基因组计划联合研究小组宣布完整破译出人体第22对染色体的遗传密码,这是人类首次成功地完成人体染色体完整基因序列的测定,解读结果刊登在1999年12月2日的《自然》杂志上。22号染色体的解读工作是由英国桑格中心伊安·坦哈姆博士的研究小组、日本庆应大学医学院清水信义的研究小组、美国奥克拉荷马大学与华盛顿大学的研究小组共同完成的。

英国伦敦的桑格中心是世界最大的测序中心,完成了“人类基因组计划”33%的测序任务。图为桑格中心的伊安·坦哈姆博士参与第22号染色体基因测序工作的日本科学家清水信义决定男女性别的X染色体和Y染色体

22号染色体的全貌:图中第1列与第2列显示基因的位置,箭头表示基因信息的读取方向,由第1列和第2列可知遗传信息位于DNA双股的哪一股。第3列显示的是假基因所在位置。第4列显示的是CPG岛所在位置,存在CPG岛的区域表示该处可能还有基因存在。折线图表示GC(鸟嘌呤和胞嘧啶)序列所占比例,含GC序列多的部分,基因比较集中。

 

 染色体的号码是依染色体的长度,由长到短而定的。但在50年前定染色体号码时,因当时染色技术的关系,21号染色体看起来比22号染色体要长,实际上21号染色体比22号染色体更短。也就是说,22号染色体是次短的,它由大约5000万个碱基对组成。染色体包括长臂、短臂及它们之间的着丝点3部分构成,22号染色体的长臂约有3400万个碱基对,短臂约1500万个碱基对。分析结果共发现545个基因,134个假基因(假基因指那些目前未发现其有什么功能的基因),并初步断定了22号染色体上与遗传病有关的一些基因。

  科学家介绍说,每个人之间基因组并不完全相同,也叫基因组的多态性,这个多态性就表现在DNA序列上。统计表明:任意两人之间的DNA核苷酸差异约占基因组的万分之一。就是这基因组的万份之一的差异,决定了人类的遗传多样性,如有的人容易生病,而有的人却对疾病的免疫力特别高, 染色体由长臂、短臂及它们之间接合的部分着丝点构成。有些药物,有人用了就灵验,有人就不灵验。只有从不同个体DNA序列的差异上阐明人类基因组的多态性,才能真正了解与疾病特别是多基因疾病有关的遗传机制,同时深入准确地了解人类起源、进化和迁徙过程中的DNA序列变化。



 

 

北京华大基因研究中心人类基因组计划中国部分主战场(377)实验室
人类基因组计划"中国卷"框架图

人类基因组计划“中国卷”完成图

 

人体的第二张解剖图——人类基因组图谱

2000年6月26日,文特尔与科林斯在美国白宫新闻室联合宣布成功绘制出人类基因组草图。英国《自然》杂志2001年2月15日出版的人类基因组图谱专集。

人类第一号、第二号、第三号染色体基因组图谱局部  1543年,比利时解剖学家A·维萨里(1514-1564)发表了划时代的著作《人体的构造》,开创了人体解剖学,使人们从宏观上了解了自己。“人类基因组计划”建立的人类基因组图,被誉为“人体的第二张解剖图”,它将从微观上或者说从根本上使人类了解自己。

  2000年6月26日,美国总统克林顿和英国首相布莱尔联合宣布:人类有史以来的第一个基因组草图已经完成。2001年2月12日 中、美、日、德、法、英等6国科学家和美国塞莱拉公司联合公布人类基因组图谱及初步分析结果。

  人类基因组计划中最实质的内容,就是人类基因组的DNA序列图,人类基因组计划起始、争论焦点、主要分歧、竞争主战场等都是围绕序列图展开的。在序列图完成之前,其他各图都是序列图的铺垫。也就是说,只有序列图的诞生才标志着整个人类基因组计划工作的完成。2000年6月28日,中国国家主席江泽民发表讲话说:“人类基因组计划是人类科学史上的伟大科学工程,它对于人类认识自身,推动生命科学、医学以及制药产业的发展,具有极其重大的意义……人类基因组序列是全人类的共同财富,应该用来为全人类造福。”


   

 


2003年4月15日,在DNA双螺旋结构模型发表50周年前夕,中、美、日、英、法、德六国元首或政府首脑签署文件,六国科学家联合宣布:人类基因组序列图完成。

  人类基因组图谱的绘就,是人类探索自身奥秘史上的一个重要里程碑。它被很多分析家认为是生物技术世纪诞生的标志,也就是说,21世纪是生物技术主宰世界的世纪。正如一个世纪前量子论的诞生被认为揭开了物理学髟椎?0世纪一样。

2004年4月15日,中国政府总理温家宝和参与国际人类基因组计划的其他五国元首或政府首脑签署文件,宣布人类基因组序列图完成。2000年8月24日,第九届全国人大常委会委员长李鹏和出席全国人大常委会的400多名委员视察中国科技馆,李鹏专门听取了科学家对于人类基因组计划的介绍。图为李鹏在人大副委员长、中国科协主席周光召(左)和中国科技馆馆长王渝生的陪同下观看介绍人类基因计划的展板。

水稻基因组计划

 水稻是最重要的粮食作物之一,全世界一半以上的人口以水稻为主食。“民以食为天”、“贵五谷而贱金玉”,我国这些充满哲理的古老格言,可以作为说明水稻基因组计划意义的首选注解。1997年9月,水稻基因组测序国际联盟在新加坡举行的植物分子学大会期间成立。1998年2月,中、日、美、英、韩五国代表制定了“国际水稻基因组测序计划”,预计到2008年完成目标。这是继“人类基因组计划”后的又一重大国际合作的基因组研究项目。



中国是世界上最早栽培水稻的国家之一,拥有7000年的水稻栽培历史。

中国培育的“超级稻”硕大饱满的稻穗如同瀑布一样


 为充分开发利用超级杂交稻这一宝贵的国家资源,继续保持我国在杂交水稻育种领域的国际领先地位,由中国科学院基因组信息学中心暨北京华大基因研究中心发起,中科院遗传与发育研究所和国家杂交水稻工程技术研究中心合作参加的“中国超级杂交水稻基因组计划”于2000年5月11日正式启动,宣布将用“霰弹法”测定籼稻基因组序列。中国科学家成功研制出霰弹法基因组组装的计算机软件体系,加上中科院计算所国家智能计算机研究开发中心研制的“曙光3000”和国家并行计算机工程技术研究中心研制的“神威”这两种高性能的国产计算机,共同为我国水稻基因组的测序工作迅速完成奠定了强有力的基础。



“神威”总设计师金怡濂院士和“神威”计算机华大基因研究中心国产“曙光”计算机和华大基因研究中心主任杨焕明

 

美国《Science》杂志2002年第4期封面上我国秀美的云南红河哈尼梯田“民以食为天“这句中国古老的格言出现在美国《Science》2002年第4期的插页上。

英国《Nature》杂志2002年第11期封面上的水稻2002年4月5日,美国著名的《科学》杂志封面上出现了秀美的云南红河哈尼梯田,以14页的篇幅发表了中国科学家《水稻(籼稻)基因组的工作框架序列图》一文。同年11月21日,英国著名的《自然》杂志的封面上又出现了沉甸甸的水稻稻穗,以“水稻基因染色体一号和四号冲破了终点线”为封面要目,同时发表了中国科学家完成的第四号染色体精确测序和日本科学家完成的第一号染色体精确测序的论文。《自然》杂志审稿人认为 这两篇论文“是紧接着水稻基因组草图完成后水稻基因组测序项目里程碑性的事件”。

 

 

水稻第四号染色体测序专家工作组部分成员在实验室合影中国水稻(籼稻)基因组“精细图”完成新闻发布会

水稻第四号染色体测序专家工作组组长、中科院国家基因研究中心韩斌博士观看第四号染色体测序图

  我国科学家完成的水稻基因组“精细图”,覆盖了染色体全长序列的98%,共鉴定了4658个基因,并注释在染色体的准确位置上,覆盖基因组94%染色体定位序列的单碱基准确性达到了99.99%,达到国际公认的基因精细图标准。它不仅将为全球从事水稻和植物生物学研究的科学家提供急需的数据,为功能基因组学和蛋白质组学的研究奠定坚实基础,而且将为全面阐明水稻的生长、发育、抗病、抗逆和高产规律,推动遗传育种研究产生重大影响。

2002年12月12日,中国科学院、国家科技部、国家发展计划委员会和国家自然基金会联合举行新闻发布会,宣布中国水稻(籼稻)基因组“精细图”已经完成。

小知识:框架图与精细图

框架图是覆盖基因组的大于90%序列的基因图谱,但仍存在洞隙、序列不确定的区域和未在染色体上定位的序列。精细图是基因组中所有基因覆盖区域的碱基序列都精确,基因都定位于染色体上的基因图谱。“框架图”是相对于“完成图”或“终图”而言的,但实际上,真正的“完成图”并不存在,因为它总会存在一些空隙,而”精细图“则比”框架图“更进一步,更为准确、精细。

  从DNA双螺旋结构模型诞生,到人类基因组计划全面完成,人类历史恰好走过了半个世纪。这50年里,科学家们在一步步破解生命的奥秘。这其中,我们不仅看到了基因科学的发展历程,也看到了科学家们的聪明智慧,同时更看到了他们为追求真理而不懈探索的崇高精神。

  破译遗传密码和基因组测序,为人类深入了解生命并进而改造生命打下了基础。但是,目前人们还只是测定了少数几种生物的基因组,还有千百万种与我们生活密切相关的生物的基因组尚待测定。而且就是在少数几个已测定的基因组中,健康、疾病、遗传特性与相应基因的关系还远未彻底探明,还有更多更奇妙的生命奥秘在等待着我们去探索。