基因工程的基本技术是人工进行基因的剪切、拼接、组合。基因是一段具有一定功能的DNA分子,要把不同基因的DNA线形分子片段准确地切出来,需要各种限制性核酸内切酶(restriction endonuclease);要把不同片段连接起来,需要DNA连接酶(ligase);要结合基因或其中的一个片段,需要DNA酶(DNa polymerase)等。因此,酶是DNA重组技术中必不可少的工具,基因工程中所要用的酶统称为工具酶。
Lurva和Human(1952)以及Bertani和Weigle(1953)发现了噬菌体λ的限制作用,即用一种λ噬菌体在一种宿主细胞生长良好,但在另一种宿主细胞中生长很差,其原因在于它的DNA受到后一种宿主的“限制”。由此发现了限制-修饰系统。
各种细菌都能合成一种或几种顺序专一的核酸内切酶。这些酶切割DNA的双链,因为它们的功能就是切割DNA,限制外源性DNA存在于自身细胞内,所以称这种核酸内切酶为限制酶。合成限制酶的细胞自身的DNA可以不受这种酶的作用,因为细胞还合成了一种修饰酶,它改变了限制酶识别的DNA顺序的结构,使限制酶不能起作用。限制-修饰系统是细胞的一种防卫手段。如果用噬菌体去感染限制-修饰系统有活性的细菌,噬菌体DNA没有先经修饰,它与先经修饰的噬菌体相比,感染效率要低几个数量级。未经修饰的噬菌体DNA进入细胞后被限制酶切成片段,片段的数目与DNA分子中限制酶的识别点数目成正比,这些片段进一步被细胞的核酸外切酶降解,就会开始裂解感染,由此产生的子代噬菌体全部带有修饰过的DNA,因此能以很高的效率去感染另一些具有相同限制-修饰系统的细菌。目前,从各种生物中分离出的限制性内切酶已超过175种,其中80多种是切割DNA双链。
(一)命名原则
限制性内切酶主要是从原核生物中提取的。现在通用的命名原则是:第一个字是细菌属名的第一个字母,第二、三个字是细菌种名的前二个字母,这些字母都用斜体字母;接下去是细菌株的第一个字母,用正体字母书写。如果同一菌株中有几种不同的内切酶时,则分别用罗马数字Ⅰ、Ⅱ、Ⅲ……来代表。现在列表举例说明如下(表23-1)。
表23-1 几种限制性内切酶命名原则举例
细菌原名 | 细菌种名 | 菌株名称 | 限制酶名称 |
Arthrobacter | Luteus | AluⅠ | |
Bacillus | amyloliquefaciens | H | BamHⅠ |
Escherichia | Coli | RY13 | EcoRⅠ |
Haemophilus | influeuzae | Rd | HindⅢ |
(二)分类和特性
限制性内切酶主要分成三大类。第一类限制性内切酶能识别专一的核苷酸顺序,并在识别点附近的一些核苷酸上切割DNA分子中的双链,但是切割的核苷酸顺序没有专一性,是随机的。这类限制性内切酶在DNA重组技术或基因工程中没有多大用处,无法用于分析DNA结构或克隆基因。这类酶如EcoB、EcoK等。
第二类限制性内切酶能识别专一的核苷酸顺序,并在该顺序内的固定位置上切割双链。由于这类限制性内切酶的识别和切割的核苷酸都是专一的。所以总能得到同样核苷酸顺序的DNA片段,并能构建来自不同基因组的DNA片段,形成杂合DNA分子。因此,这种限制性内切酶是DNA重组技术中最常用的工具酶之一。这种酶识别的专一核苷酸顺序最常见的是4个或6个核苷酸,少数也有识别5个核苷酸以及7个、9个、10个和11个核苷酸的。如果识别位置在DNA分子中分布是随机的,则识别4个核苷酸的限制性内切酶每隔46(4096)个核苷酸就有一个切点。人的单倍体基因组据估计为3×199核苷酸,识别4个核苷酸的限制性内切酶的切点将有(3×109/2.5×102)约107个切点,也就是可被这种酶切成107片段,识别6个核苷酸的限制性内切酶也将有(3×109/4×103)约106个切点。
第二类限制性内切酶的识别顺序是一个回文对称顺序,即有一个中心对称轴,从这个轴朝二个方向“读”都完全相同。这种酶的切割可以有两种方式。一是交错切割,结果形成两条单链末端,这种末端的核苷酸顺序是互补的,可形成氢键,所以称为粘性末端。如EcoRI的识别顺序为:
↓ |
5’……GAA | TTC……3’
3’……CTT | AAG……5’
| ↑
垂直虚线表示中心对称轴,从两侧“读”核苷酸顺序都是GAATTC或CTTAAG,这就是回文顺序(palindrome)。实线剪头表示在双链上交错切割的位置,切割后生成5’……G和AATTC……3’、3’……CTTAA和G……5’二个DNA片段,各有一个单链末端,二条单链是互补的,可通过形成氢键而“粘合”。另一种是在同一位置上切割双链,产生平头末端。例如HaeⅢ的识别位置是:
↓
5’……GG↓CC……3’
3’……CC↓GG……’
↑
在箭头所指处切割,产生的两个DNA片段是:
5’……GG CC……3’
和
3’……CC GG……5’
有时候两种限制性内切酶的识别核苷酸顺序和切割位置都相同,差别只在于当识别顺序中有甲基化的核苷酸时,一种限制性内切酶可以切割,另一种则不能。例如HpaⅡ和MspⅠ的识别顺序都是5’……GCGG……3’,如果其中有5’-甲基胞嘧啶,则只有HpaⅡ能够切割。这些有相同切点的酶称为同切酶或异源同工酶(isoschizomer)。
第三类限制性内切酶也有专一的识别顺序,但不是对称的回文顺序。它在识别顺序旁边几个核苷酸对的固定位置上切割双链。但这几个核苷酸对则是任意的。因此,这种限制性内切酶切割后产生的一定长度DNA片段,具有各种单链末端。这对于克隆基因或克隆DNA片段没有多大用处。
细胞的限制-修饰系统中的修饰作用是由甲基化酶(methylase)来完成的。甲基化酶同限制性内切酶具有完全相同的识别顺序。甲基化酶使识别顺序中的某个碱基发生甲基化,保护DNA不被限制性内切酶切开。
真核生物中目前只发现5-甲基胞嘧啶(M5C)。M5C占整个胞嘧啶中的2~7%(果蝇和某些昆虫例外)。M5C大多以M5CpG的形式存在,不同物种或同一物种的不同组织中,M5C出现的频率也不尽相同。目前已经纯化作为商品出售的甲基化酶见表23-2。
将限制性内切酶和甲基化酶同时作用,可使有几种可能识别顺序的限制性内切酶只对其中一种识别顺序有效。例如限制性内切酶AvaⅠ的识别顺序是:
5’……CPyCGPuG……3’
3’……GPuGCPyC……5’
Py可以是任何一种嘧啶,pu可以是任何一种嘌呤。因此可以有4种识别顺序。如果同时使用甲基化酶TaqⅠ和甲基化酶HpaⅡ,则AvaⅠ的识别顺序将只是5’……CCCGAG……3’。现用图解说明(图23-1)。
如果有一个DNA片段,有AvaⅠ的3个识别顺序,当用AvaⅠ处理后可得4个片段。可是,如果先用TaqⅠ甲基化酶和HpaⅡ甲基化酶使DNA顺序中的有些碱基甲基化,然后再用AvaⅠ去切,结果只有1个识别顺序可被AvaⅠ作用,只产生2个DNA片段。
图23-1 几种限制性内切酶和甲基化的碱基
表23-2 甲基化酶及甲基化的碱基
甲基化酶名称 | 甲基化的碱基 |
AluⅠ | 5’……AGC*T……3’ |
BamHⅠ | 5’……GGATC*C……3’ |
ClaⅠ | 5’……ATCGA*T……3’ |
damⅠ | 5’……GA*TC……3’ |
EcoRⅠ | 5’……GAA*TTC……3’ |
HaeⅢ | 5’……GCC*C……3’ |
HhaⅠ | 5’……GC*GC……3’ |
HpaⅡ | 5’……CC*GC……3’ |
HphⅠ | 5’……TC*ACC……3’ |
MspⅠ | 5’……C*CGG……3’ |
PstⅠ | 5’……CTGCA*C……3’ |
TaqⅠ | 5’……TCGA*……3’ |
*表示甲基化
(DNa polymerase)的作用是将1个脱氧三磷酸核苷酸加到引物(primer)的3’-OH上www.med126.com/yaoshi/,释放出一个焦磷酸分子(ppi),如下式表示。
聚合酶主要有以下几种:
1.大肠杆菌DNA聚合酶Ⅰ大肠杆菌DNA聚合酶(E.ColiDNA polymerase)主要有3种作用:①5’→3’的聚合作用。但不是复制染色体而是修补DNA,填补DNA上的空隙或是切除RNA引物后留下的空隙。②3’→5’的外切酶活性。消除在聚合作用中掺入的错误核苷酸。③5’→3’外切酶活性。切除受损伤的DNA。它在切口平移(nick translation)中的应用,将在下面介绍。
大肠杆菌DNA聚合酶Ⅰ的Klenow片段是完整的DNA聚合酶Ⅰ的一个片段,只有在5’→3聚合酶活性和3’→5’外切酶活性,失去了5’→3外切酶活性。它可用于填补DNA单链末端成为双链。如果供给32P标记的三磷酸核苷酸,则可使DNA带上同位素标记。当用交错切割的限制酶切成带有单链粘性末端的DNA片段,要用被切成平头末端的DNA片段连接时,可以先用Klenow片段使粘性末端的单链补齐成为平头,然后在DNA连接酶作用下把两个DNA片段连接起来。
另外还有大肠杆菌DNA聚合酶Ⅱ和大肠杆菌DNA聚合酶Ⅲ。前者不能利用单链DNA或poly(dA-dT)为模板。需有镁离子和dNTP时才能表现出酶活性,无自发合成DNA的作用。后者没有5’→3外切酶活性,也不能用单链DNA作为模板。
2.噬菌体DNA聚合酶这里以T4DNA聚合酶为例。它也具有5’→3聚合酶活性,但它的外切酶活性比大肠杆菌的要高200倍。因此,它也可用来补齐单链末端或标记同位素。
RNA聚合酶(RNapolymerase)的作用是转录RNA。有的RNA聚合酶有比较复杂的亚基结构。如大肠杆菌RNA聚合酶有四条多肽链,另有一个促进新RNA分子合成的σ因子,因此它的组成的是α2ββσ。这种结构称为全酶(holoenzyme),除去了σ因子的酶称为核心酶。噬菌体RNA聚合酶则没有亚基。
真核生物的RNA聚合酶分三类。RNA聚合酶Ⅰ存在于核仁中,转录rRNA顺序。RNA聚合酶Ⅱ存在于核质中,转录大多数基因,需要“TATA”框。RNA聚合酶Ⅲ存在于核质中,转录很少几种基因如tRNA基因如5SrRNA基因。有些重复顺序如Alu顺序可能也由这种酶转录。上面提到的“TATA”框又称Goldberg –Hogness顺序,是RNA聚合酶Ⅱ的接触点,是这种酶的转录单位所特有的。它在真核生物的转录基因的5’端一侧,在转录起点上游20至30个核苷酸之间有一段富含AT的顺序。如以转录起始点为0,则在-33到27个核苷酸与-27至21核苷酸之间,有一个“TATA”框。一般是7个核苷酸。RNA聚合酶Ⅱ转录单位的典型结构如图23-2。原核生物中也类似“TATA”框的结构。RNA聚合酶作用在“TATAAT”(Pribnow)盒和“TTGA-CA”框附近。
图23-2 反转录酶的作用机理
反转录酶(Reverse transcripatase)是以RNA为模板指导三磷酸脱氧核苷酸合成互补DNA(cDNA)的酶。哺乳类C型病毒的反转录酶和鼠类B型病毒的反转录酶都是一条多肽链。鸟类RNA病毒的反转录酶则由两上亚基结构。真核生物中也都分离出具有不同结构的反转录酶。这种酶需要镁离子或锰离子作为辅助因子,当以mRNA为模板时,先合成单链DNA(ssDNA),再在反转录酶和DNA聚合酶Ⅰ作用下,以单链DNA为模板合成“发夹”型的双链DNA(dsDNA),再由核酸酶S1切成二条单链的双链DNA。因此,反转录酶可用来把任何基因的mRNA反转录成cDNA拷贝,然后可大量扩增插入载体后的cDNA。也可用来标记cDNA作为放www.med126.com射性的分子探针。
大肠杆菌核酸外切酶Ⅲ(exonucleaseⅢ)是从带3’-OH末端的双链DNA,按3’→5’方向切除5’单核苷酸:
大肠杆菌核酸外切酶Ⅶ则是从单链DNA的3’端和5’端切除寡核苷酸(两种形式):
(1)(2)
前一种酶需要镁离子作辅助因子才有活性;后一种酶则不需镁离子,因此即使在有螯合剂EDTA的情况下也有活性。另一种从噬菌体λ感染的大肠杆菌中提取的λ核酸外切酶是从带有5’磷酸末端的双链DNA上,逐个切除5’单核苷酸,在反应时需要镁离子:
核酸酶S1(nucleaseS1)主要是降解单链DNA或单链RNA。对单链DNA的活性更高。它的用途是切除DNA片段的单链末端使之成为平头末端,切开合成dscDNA时形成的“发夹”环以及分析DNA-RNA杂合子的结构。
DNA酶Ⅰ(DNaseⅠ)是随机水解双链或单链DNA的一种内切酶,使DNA分子降解成带有5’磷酸末端的单核苷酸和寡核苷酸的混合物:
在进行重组DNA研究时,必须注意防止DNA酶的污染,否则制备的DNA样品将会降解。因此器皿或试剂高温处理,样品中加EDTA,或放置冰上以破坏或抑制酶活性。
RNA酶A(ribonuclease A)作用于嘧啶核苷酸的3’磷酸根上,切开与相邻核苷酸连接的5’磷酸键。另一种RNA酶T1只作用于鸟嘌呤核苷酸的3’磷酸根,切开与相邻核苷酸连接的5’磷酸键。人体的分泌物如唾液,汗液中都含有RNA酶。因此在操作RNA样品时,必须戴手套,实验用的玻璃器皿都要经250℃烘烤4h(RNA酶耐热),或用RNA酶的抑制剂处理。
最常用的是T4DNA连接酶(T4DNa ligase),催化双链DNA中相邻的3’OH与5’磷酸根之间形成磷酸二酯键,它可用来连接具有粘性末端的两个DNA片段,或连接两个平头末端的DNA片段,使之成为一个重组DNA分子。可是这种酶只能连接双链DNA而不能连接单链DNA分子。T4RNA连接酶则可在单链DNA分子或RNA分子的5’磷酸根和3’-OH之间催化生成共价键。
末端脱氧核苷酸转移酶(terminal deoxynucleotidetransferase)的作用是将脱氧核苷酸加到DNA分子的3’-OH末端。
从DNA或RNA的三磷酸脱氧核糖核苷酸或三磷酸核糖核苷酸上除5’-磷酸根残基。一般的用途是用这种酶处理DNA或RNA后,在5’端上标记32P。在经限制性内切酶酶切DNA片段后,用碱性磷酸酶(alkaline phosphatase)处理可以阻止酶切的片段自身连接,这在克隆DNA片段时特别有用。