核酸分子雜交是基因診斷的最基本的方法之一。它的基本原理是:互補的DNA單鏈能夠在一定條件下結(jié)合成雙鏈,即能夠進行雜交。這種結(jié)合是特異的,即嚴格按照堿基互補的原則進行,它不僅能在DNA和DNA之間進行,也能在DNA和RNA之間進行。因此,當用一段已知基因的核酸序列作出探針,與變性后的單鏈基因組DNA接觸時,如果兩者的堿基完全配對,它們即互補地結(jié)合成雙鏈,從而表明被測基因組DNA中含有已知的基因序列。由此可見,進行基因檢測有兩個必要條件,一是必需的特異的DNA探針;二是必需的基因組DNA。當兩者都變性呈單鏈狀態(tài)時,就能進行分子雜交。
一、基因探針
基因探針(probe)就是一段與目的基因或DNA互補的特異核苷酸序列,它可以包括整個基因,也可以僅僅是/基因的一部分;可以是DNA本身,也可以是由之轉(zhuǎn)錄而來的RNA。
1.探針的來源 DNA探針根據(jù)其來源有3種:一種來自基因組中有關(guān)的基因本身,稱為基因組探針(genomic probe);另一種是從相應(yīng)的基因轉(zhuǎn)錄獲得了mRNA,再通過逆轉(zhuǎn)錄得到的探針,稱為cDNa 探針(cDNa probe)。與基因組探針不同的是,cDNA探針不含有內(nèi)含子序列。此外,還可在體外人工合成堿基數(shù)不多的與基因序列互補的DNA片段,稱為寡核苷酸探針。
2.探針的制備 進行分子突變需要大量的探針拷貝,后者一般是通過分子克隆(molecular cloning)獲得的。克隆是指用無性繁殖方法獲得同一個體、細胞或分子的大量復制品。當制備基因組DNA探針進,應(yīng)先制備基因組文庫,即把基因組DNA打斷,或用限制性酶作不完全水解,得到許多大小不等的隨機片段,將這些片段體外重組到運載體(噬菌體、質(zhì)粒等)中去,再將后者轉(zhuǎn)染適當?shù)乃拗骷毎绱竽c肝菌,這時在固體培養(yǎng)基上可以得到許多攜帶有不同DNA片段的克隆噬菌斑,通過原位雜交,從中可篩出含有目的基因片段的克隆,然后通過細胞擴增,制備出大量的探針。
為了制備cDNA 探針,首先需分離純化相應(yīng)mRNA,這從含有大量mRNA的組織、細胞中比較容易做到,如從造血細胞中制備α或β珠蛋白mRNA。有了mRNA作模板后,在逆轉(zhuǎn)錄酶的作用下,就可以合成與之互補的DNA(即cDNA),cDNA與待測基因的編碼區(qū)有完全相同的堿基順序,但內(nèi)含子已在加工過程中切除。
寡核苷酸探針是人工合成的,與已知基因DNA互補的,長度可從十幾到幾十個核苷酸的片段。如僅知蛋白質(zhì)的氨基酸順序量,也可以按氨基酸的密碼推導出核苷酸序列,并用化學方法合成。
3.探針的標記 為了確定探針是否與相應(yīng)的基因組DNA雜交,有必要對探針加以標記,以便在結(jié)合部位獲得可識別的信號,通常采用放射性同位素32P標記探針的某種核苷酸α磷酸基。但近年來已發(fā)展了一些用非同位素如生物素、地高辛配體等作為標記物的方法。但都不及同位素敏感。非同位素標記的優(yōu)點是保存時間較長,而且避免了同位素的污染。最常用的探針標記法是缺口平移法(nick translation),其原理如圖13-1。首先用適當濃度的DNA酶Ⅰ(DNAseⅠ)在探針DNA雙鏈上造成缺口,然后再借助于DNA聚合酶Ⅰ(DNa poly merasⅠ)的5’→3’的外切酶活性,切去帶有5’磷酸的核苷酸;同時又利用該酶的5’→3’聚酶活性,使32P標記的互補核苷酸補入缺口,DNA聚合酶Ⅰ的這兩種活性的交替作用,使缺口不斷向3’的方向移動,同時DNA鏈上的核苷酸不斷為32P標記的核苷酸所取代。
圖13-1 缺口平移標記法粗線示標記部分
探針的標記也可以采用隨機引物法,即向變性的探針溶液加入6個核苷酸的隨機DNA小片段,作為引物,當后者與單鏈DNA互補結(jié)合后,按堿基互補原則不斷在其3’OH端添加同位素標記的單核苷酸,這樣也可以獲得比放射性很高的DNA探針。
二、限制性核酸內(nèi)切酶
限制性核酸內(nèi)切酶(restriction endonuclease),又簡稱限制酶或內(nèi)切酶。它們是基因工程和基因診斷重要的一類工具酶。它們的發(fā)現(xiàn)和應(yīng)用為從基因組中分離目的基因提供了必要的手段.限制酶能特異地識別和切割特異的核苷酸序列,將雙鏈DNA切成較小的片段。酶切后目的基因可能完整地或部分地保存于某一DNA片段上,并被分離出來。
限制酶主要來源于原核生物,是一組能水解DNA磷酸二酯鍵的酶。迄今已發(fā)現(xiàn)的限制酶多達數(shù)百種,分為三類。在基因工程中使用的主要是第二類。限制酶根據(jù)其來源命名。例如,限制酶EcoRⅠ來源于大桿菌E.coli的RY13菌株,Ⅰ指在該菌株中分離的第一個限制酶。
下面是一些最常用的限制酶的來源及其識別順序(表13-1)
每種限制酶識別和切割的通常為4-6個核苷酸序列,稱為限制性位點(restriction sites)或切點.限制酶切割雙鏈DNA的方式有兩種,產(chǎn)生的末端也有兩種:第一種是交錯切割,即兩條鏈的切點不在同一水平而是相隔數(shù)個堿基,故斷口產(chǎn)生兩小段自身互補的單鏈,這種末端容易互補連接,稱為粘性末端(cohesive terminus);第二種為平整切割,即兩
表13-1 常用的限制酶的來源及其識別順序列
名稱 |
識別序列 |
來源 | |||||||
Ava |
|
Anabaena variabilis | |||||||
Bam H | G↓GATCC | Bacillus amyloliquefaciens H | |||||||
Bgl Ⅱ | A↓GATCT | Bacillus globigii | |||||||
Eco RⅠ |
|
Escherichia coliRY13 | |||||||
Eco RⅡ |
|
Escherichia coliR245 | |||||||
HaeⅢ |
|
Haemophilus aegyptius | |||||||
HindⅢ |
|
Hemophilus influenzae Rd | |||||||
HpaⅠ | GTT↓AAC | Haemophilus parainfluenzae | |||||||
HpaⅡ |
|
同上 | |||||||
KpnⅠ | GGTAC↓C | Klebsiella pneumoniae | |||||||
MboⅠ | ↓GATC | Moraxella bovis | |||||||
PstⅠ | CTGCA↓G | Providencia stuartii |
*被甲基化
條鏈在同一水平切開,得到平齊末端(blunt terminus)(圖13-2)。由于具有相同粘性
圖13-2 限制酶的兩類切割方式
末端的DNA片段在DNA連接酶的作用下很容易共價連接,因此被廣泛地應(yīng)用于重組DNA操作中。具有相同平齊末端的DNA片段也可以連接,但連接效率只有粘性末端連接效率的1%。
限制酶的上述特性在基因工程和基因診斷中具有重要用途:①首先不論DNA的來源如何,用同一種內(nèi)切酶切割后產(chǎn)生的粘性末端很容易重新連接,因此很容易將人和細菌或人和質(zhì)粒任何兩個DNA片段連接在一起,即重新組合,這是重組DNA技術(shù)的基礎(chǔ)。②人類的基因組很大,不切割無法分析其中的基因。限制酶能把基因組在特異的部位切開,即切割不是隨機的,因而從每個細胞的基因組得到的是相同的一組長度各異的片段。這些可能含有某一基因的片段可用電泳分離,并加以研究。③由于限制酶的特異性,如果識別位點的堿基發(fā)生了改變,限制酶將不再能切割;同樣,堿基的改變也可能導致出現(xiàn)新的酸切位點。在人類基因組中,這兩種情況是十分常見的,而切點的消失或出現(xiàn)將影響獲得的DNA片段的長度,表現(xiàn)為限制性片段長度多態(tài)性(RFLP),這在基因的連鎖診斷中具有極重要的意義。
三、限制性片段長度多態(tài)性
一個人的兩套單倍體DNA是不完全相同的,一般每100-500個堿基對就有一個是不相同的。換言之,如果把兩套基因組DNA(各3.2×109bp)排列起來,那么平均有1000萬處不同,它們多位于內(nèi)含子序列中。實際上,除單卵雙生子外,人群中沒有兩個個體的基因組DNA是完全相同的。
DNA的多態(tài)性雖可通過DNA測序檢出,但用限制酶消化卻是最常用的檢測方法。
1.RFLP由于堿基的變異可能導致酶切點的消失或新的切點出現(xiàn),從而引起不同個體在用同一限制酶切時,DNA片段長度出現(xiàn)差異(圖13-3),這種由于內(nèi)切酶切點變化所導致的DNA片段長度的差異,稱為限制性片段長度多態(tài)性(restriction fragment length polymporphism, RFLP)。RFLP反映了常見的個體間DNA核苷酸的可遺傳性變異,它按照孟德爾方式遺傳。RFLP可用Southern印跡雜交法(見下節(jié))檢出。用Southern雜交檢出RFLP時,如探針跨越切點,則被切開的兩個片段均可與探針雜交,從而顯示兩條雜交帶(圖13-4)。
圖13-3 RFLP示意圖箭頭酶切位點;
左圖:等位基因2由于出現(xiàn)新的切點,DNA片段縮至8kb;
右圖:DNA片段電泳后雜交圖
13-4 RFLP的檢出等位基因1因有額外切點而導致產(chǎn)生
兩個長短不同的DNA片段(3kb及5kb)且均能與探針雜交
2.兩點RFLP
(1)點多態(tài)(point polymorphism):是由于單個或少數(shù)堿基的改變引起酶切點的出現(xiàn)或消失所致的RFLP。上述的RFLP即屬于這一類。它們屬經(jīng)典的RFLP。在人類基因組中已發(fā)現(xiàn)數(shù)以百計的此類多態(tài)位點。
。2)數(shù)目變異的串連重復(variable number tandem repeats,VNTR):上述經(jīng)典的單個堿基取代所致的RFLP一般只能檢測到一種雜合性的兩種形式,即“有”或“無”某個限制酶切位點,而且每個位點在人群中的雜合子頻率通常不會超過50%,當被測個體為純合狀態(tài)時,利用RFLP就無法得到所需要的多態(tài)信息。此外,在整個基因組中,這類RFLP目前發(fā)現(xiàn)的數(shù)量還有限,并分布不勻。
但是,在人類基因組中還存在一類DNA重復序列,稱為小衛(wèi)星DNA。它們分布十分廣泛,每一個單位通常只有16-28bp長,但其重復次數(shù)在人群中是高度變異的。當用限制酶切割VNTR區(qū)時,只要酶切點不在重復區(qū)內(nèi),就可能得到各種長度不同的片段(圖13-5)
與小衛(wèi)星DNA不同,另一類重復序列是衛(wèi)星DNA。它們的基本序列有1-6bp,如(TA)n、(CGG)n等,通常重復10-60次并呈高度的多態(tài)性。
圖13-5 VNTR導致的RFLP重復次數(shù)的變異致酶切位點的移動和DNA片段長度的變異
VNTR具有高度的變異性,同時也是按照孟德爾方式遺傳的,因此是很好的遺傳標記,由于它們類型眾多和在基因組中分布廣泛,因而在基因連鎖診斷中應(yīng)用日益廣泛。