基因工程的基本过程

基因工程主要包括几个过程:

1、目的基因的制备;
2、选择合适的载体,将目的基因与载体相连接生成重组DNA分子;
3、将重组DNA片段导入受体;
4、选择目的基因;
5、目的基因的表达。

对于整个基因过程来讲,目的基因的获取是关键,它直接涉及到产物,而且还影响到产物的量。很多在基因操作过程中,目的基因是很难获得的,所以通常采取先生成基因文库的方法,然后从基因文库中筛选。如果目的基因的序列以及它的调控等信息很清楚,可以直接通过PCR或cDNA获取,这样就大大减少了选择目的基因的盲目性,可以将整个过程简化为以下步骤:

图10-3-8 基因工程过程

 

(1)目的基因的分离和制备

目的基因是指准备导入受体细胞内的,以研究或应用为目的所需要的外源基因称目的基因。获得目的基因的方法很多,但也是十分困难的一步。目前获得目的基因有4条途径:

1.从生物基因组群体中分离目的基因
    原核生物基因组较小,基因容易定位,用限制性内切酶将基因组切成若干段后,用带有标记的核酸探针,从中选出目的基因。真核生物一般通过基因组文库的方法获得目的基因。

图10-3-1 限制性内切酶

限制性内切酶(restrictive enzyme)是20世纪60年代末在细菌中发现的,能水解DNA分子骨架的磷酸二酯键,使一个完整的DNA分子切成若干段,每一种限制酶,都有自己特定的作用位点,而且切口或切下来的序列,往往是回文结构(palindromes)。例如Eco RI把GAATTC在GA之间切开,形成粘性末端。也有一些限制酶作用的结果产生不含粘性末端的平整末端,如HapI。多在原核生物中存在,能识别4~6个特苷酸特定的碱基序列。限制酶对细菌有保护作用,某些入侵的噬菌体可因DNA链被限制性酶切断而不能在细菌中繁殖,“限制”因此而得名。限制酶不能切开细菌本身的DNA,这是因为细菌DNA的腺嘌呤和胞嘧啶甲基化(-CH3)而受到保护之故。

这样就可以用限制性内切酶把一个基因组DNA分成很多片段,对于原核生物比较小的基因组来说,可以直接用标记地探针来获取在通过特定的方法,对于比较大的基因组,可以先制作基因文库,然后钓取所需要的带有目的基因的片段。

2.人工合成目的基因DNA片段
    人工合成目的基因DNA片段有化学合成和酶促合成法两条途径。一般是采用DNA合成仪来合成长度不是很大的DNA片段。

3.PCR反应合成DNA
    聚合酶链式反应(PCR)是以DNA变性、复制的某些特性为原理设计的。通过PCR技术获取所需要的特异DNA片段在实际应用用得非常多,但是前提条件是必须对目的基因有一定的了解,需要设计引物。PCR技术的原理如下:

图10-3-2 PCR原理图

(1)以混合的 DNA 片段作模板,例如,可以用 cDNA 基因文库做模板,在 90℃ 高温下,作为模板的双链 DNA 均变性,分开成为单链DNA。
(2)在反应体系中以有两种合成的 DNA 小段寡聚核苷酸做引物,这两种寡核苷酸应可以分别和特异 DNA 片段的正链的 3'末端与负链的 3'末端相结合。寡核苷酸引物要在 50℃ 的温度下,才能较好的找到可以配对的正链和负链,形成互补结合。显然,在混合 DNA 片段作模板的情况下,只有可以形成配对关系的 DNA 链才可特异性地结合引物寡核苷酸。这个过程又称为淬火。
(3)反应体系中还有高温 DNA 聚合酶,以及作为原材料的四种脱氧核苷三磷酸(4 X dNTP) 。高温 DNA 聚合酶来自一种特殊的耐高温细菌,俗称 Taq 酶。在 70℃ 高温下,经 Taq 酶催化,以四种脱氧核苷三磷酸为原料,在形成互补的引物寡核苷酸后,迅速合成一条与模板 DNA 单链(正链或负链)互补结合的DNA新链。
(4)以上三个步骤周而复始,即反应体系的温度从 90oC- 50oC- 75oC,反应体系中经历:变性( DNA 双链变性生成单链)——淬火(寡核酸引物和特异的 DNA 模板结合,配对)——合成(以引物为起点,合成与模板互补的 DNA 新链)。每次循环约需6-10分钟。经过20次循环,能与引物特异结合的那段 DNA ——即需要放大增殖目的 DNA 分子,可以扩增106倍。

4.mRNA差异显示法获得目的基因
    mRNA差异显示(mRNA differential display, DD)是1992年由哈佛医学院Peng Liang等人建立的。原理是先用PCR技术扩增所有的mRNA、生成cDNA群体,再用测序凝胶电泳获取所需要的目的基因,然后再次用PCR扩增。简单的讲,就是从基因的转录产物mRNA来反转录成cDNA作为目的基因。

5、用机械的方法,例如超声波把基因组打成片段。

 

(2)DNA片段和载体的连接

外源基因(DNA片段)很难直接透过受体细胞的细胞膜进入受体细胞,即使进入,也会受到细胞内限制性酶的作用而分解。要将外源DNA片段导入受体细胞,必须选择适当的载体(Vector),这是关键步骤之一。

载体是携带外源基因进入受体细胞的工具。作为载体的DNA分子,需具备两项基本条件:①容易进入寄主细胞;②进入寄主细胞后能够独立进行自主的复制和表达;③容易从宿主细胞中分离纯化。

通常在基因工程中选作载体的有:
①质粒——环状双链小型 DNA 分子,种类甚多,有的可在细菌细胞内独立复制,有的亦可用于动、植物细胞。 例如:根瘤土壤杆菌所携带的 Ti 质粒常用作植物细胞基因工程的载体。人工改造的质粒常用的有pBR322天然质粒,派生质粒pmB1,psC101等
②噬菌体——常用的是λ噬菌体。经构建后,常用于细菌细胞。常见的有Mu噬菌体载体。
③病毒——例如猿猴空泡病毒 SV40 常用作动物细胞基因工程的载体。 
④粘粒(cosmid,装配性质粒),由质粒和Mu噬菌体的cos位点u或膜等构建而成的一种大容量克隆载体。

含有目的基因的DNA片段和载体DNA连接技术即DNA重组技术,其核心步骤是DNA片段之间的体外连接,其本质是涉及限制酶,连接酶等酶促反应过程。载体为细菌中的质粒,温和噬菌体。重组DNA即载体DNA+引入的DNA。把目的基因连接到载体上去,要经过一系列酶促反应,需要几种工具酶,这中间最为重要的是两大类酶:
①DNA 限制性内切酶:把载体DNA片段切开。
②DNA 连接酶:用于连接载体和外源DNA片段。
此外,在构建 DNA 重组分子中使用的工具酶还有:DNA 聚合酶、逆转录酶、DNA 修饰酶、RNA 修饰酶、核酸外切酶、碱性磷酸酶等。

1、粘性末端的连接:用同一种限制性内切酶或者用能够产生相同粘性末端的两种限制性内切酶分别消化外源DNA分子和载体,所形成的DNA末端彼此互补,用DNA连接酶共价连接起来,形成重组体DNA分子。

图10-3-3 粘性末端的连接

2、平末端的连接:可先生成粘性末端,在带平头末端的DNA片段的3’-末端加上多聚核苷酸的尾巴,在载体上加上互补的尾巴,然后用DNA连接酶连接。

图10-3-4 用质粒构建重组DNA分子

用噬菌体DNA构建重组DNA分子

(3)外源DNA片段引入受体细胞

重组体DNA分子只有导入合适的受体细胞,才能进行大量地复制,扩增和表达。

受体细胞有多种,原核细胞、低等真核细胞生物的细胞如酵母、植物细胞、哺乳动物细胞等。胰岛素基因工程生产就是将外源DNA导入原核细胞大肠杆菌中进行表达实现的。兔免疫beta-球蛋白的基因通过SV40(猴病毒)作为载体,并入侵入培养的猴肾细胞後,猴肾细胞就可大量产生兔beta-球蛋白。

通过限制性内切酶或逆转录技术可以获取包含某生物体所有基因的DNA片段集,如果把每一个片段与载体连接并分别导入受体细胞,如大肠杆菌。这样就能得到所有的包含该生物体全套基因的库,称之为基因文库(gene library),对于期中只含有一个外源DNA片段的菌群,称之为克隆(clone)。通过基因文库的构建,就可以根据需要随时从文库中选择目的基因。

图10-3-5 基因文库的构建

重组DNA片段导入受体细胞通常有双交换和单交换的方法。

(4)选择目的基因

通过以上方法将目的基因导入受体细胞后,还需要经过筛选,才能确定真正所需要的目的基因。选择目的基因的方法有:

1、遗传学方法,根据转基因生物体的形状来确定是否满足需要,例如对于转基因作物,要判断这些作物是否有需要的性状,而且没有带来不利的性状。

2、免疫学方法,用来判断蛋白质的功能。

3、分子杂交(molecular hybridization)的方法:
    通常人们首先着眼于某一感兴趣的蛋白质,首先找到编码这个蛋白质的基因,从基因文库中“钓”得该基因,然后才可进行后面的基因工程操作步骤。首先需要制备探针(probes)。探针是根据所需基因的核苷酸顺序制成一段与之互补的核苷酸短链,并用同位素标记。下图就是用分子杂交的方法从基因文库中钓取目的基因。

图10-3-7 用分子杂交的方法从基因文库中钓取目的基因

4、PCR扩增
    在获取目的基因后,可以采用该方法可以大量扩增,得到大量的目的基因。

(5)目的基因表达

构建好的重组 DNA 分子进入寄主细胞的过程,称为转化。如果接受异源 DNA 的细胞不是细菌,而是动物细胞或植物细胞,常常称为转染。

不是所有细菌细胞或动物细胞都能接受异源 DNA,只有处于感受态的细胞才能接受异源 DNA。感受态细胞通常在细胞表面有一些特异蛋白质,在细胞接受异源 DNA 过程中起作用,称为感受态因子。另外,还有一系列技术方法帮助细胞接受外源 DNA 。这些方法包括:适当加入磷酸钙离子、DEAE- 葡聚糖、显微注射、应用脂质体或电穿孔等。

进入寄主细胞的重组 DNA 分子,其中的外源目的基因能否表达,表达效率的高低,仍有很大的差别。不少基因工程工作,因表达效率不够高而裹足不前。实际上,位于目的基因前面的启动子常常是表达效率的关键。所以,要得到目的基因的高效表达,关键首先在于选择合适的载体,尤其是寻找适合目的基因的高表达启动子。

用基因工程菌大量发酵生产某种实用的蛋白质产品,在解决高表达之后,还面临着从发酵液中分离纯化蛋白质产品的问题。如果工程菌把所需要的蛋白质分泌于细胞外,则后面的蛋白质分离纯化工作要容易的多。为此,在选择载体,构建重组 DNA 分子时都应有所考虑。如果做不到,工程菌产生的蛋白不能分泌到细胞外,则需要先使菌体破裂,再分离纯化蛋白质,那么难度要大得多。