(一)DNA的一級(jí)結(jié)構(gòu)
核酸是由很多單核苷酸聚合形成的多聚核苷酸(polynucleotide),DNA的一級(jí)結(jié)構(gòu)即是指四種核苷酸(dAMP、dCMP、dGMP、dTMP)按照一定的排列順序,通過磷酸二酯鍵連接形成的多核苷酸,由于核苷酸之間的差異僅僅是堿基的不同,故又可稱為堿基順序。核苷酸之間的連接方式是:一個(gè)核苷酸的5′位磷酸與下一位核苷酸的3′-OH形成3′,5′磷酸二酯鍵,構(gòu)成不分支的線性大分子,其中磷酸基和戊糖基構(gòu)成DNA鏈的骨架,可變部分是堿基排列順序。核酸是有方向性的分子,即核苷酸的戊糖基的5′位不再與其它核苷酸相連的5′末端,以及核苷酸的戊糖基3′位不再連有其它核苷酸的3′末端,兩個(gè)末端并不相同,生物學(xué)特性也有差異。
寡核苷酸(oligonucleotide)是指二至十個(gè)甚至更多個(gè)核苷酸殘基以磷酸二酯鍵連接而成的線性多核苷酸片段。目前多由儀器自動(dòng)合成而用作DNA合成的引物(Primer)、基因探針(probe)等,在現(xiàn)代分子生物學(xué)研究中具有廣泛的用途。
表示一個(gè)核酸分子結(jié)構(gòu)的方法由繁至簡(jiǎn)有許多種(圖15-2)。由于核酸分子結(jié)構(gòu)除了兩端和堿基排列順序不同外,其它的均相同。因此,在核酸分子結(jié)構(gòu)的簡(jiǎn)式表示方法中,僅須注明一個(gè)核酸分子的哪一端是5′末端,哪一端是3′末端,末端有無磷酸基,以及核酸分子中的堿基順序即可。如未特別注明5′和3′末端,一般約定,堿基序列的書寫是由左向右書寫,左側(cè)是5′末端,右側(cè)為3′末端。
圖15-2 核酸分子結(jié)構(gòu)的表示方式
(二)基因組DNA
自然界絕大多數(shù)生物體的遺傳信息貯存在DNA的核苷酸排列順序中。DNA是巨大的生物高分子,一般將細(xì)胞內(nèi)遺傳信息的攜帶者棗染色體所包含的DNA總體稱為基因組(genome)。同一物種的基因組DNA含量總是恒定的,不同物種間基因組大小和復(fù)雜程度則差異極大,一般講,進(jìn)化程度越高的生物體其基因組構(gòu)成越大、越復(fù)雜,見(表15-2)。
表15-2 某些有代表性的生物體內(nèi)DNA大小
分子量 | 堿基對(duì)(bp) | 千堿基對(duì)(kb) | ||
最簡(jiǎn)單的微生物 | SV40病毒 | 3×106 | 5×103 | 5 |
λ噬菌體 | 3.4×107 | 5×104 | 50 | |
細(xì)菌 | 大腸桿菌 | 2.2×109 | 4.6×106 | 4600 |
哺乳動(dòng)物 | 小鼠 | 1.5×1012 | 2.3×109 | 230萬(wàn) |
人 | 1.8×1012 | 2.8×109 | 280萬(wàn) |
DNA分子中不同排列順序的DNA區(qū)段構(gòu)成特定的功能單位,即基因(gene);虻墓δ苋Q于DNA的一級(jí)結(jié)構(gòu)。一個(gè)DNA分子能攜帶多少基因呢?如果以1000~1500bp編碼一個(gè)基因計(jì)算,猿猴病毒SV40基因組DNA有5000堿基對(duì)(base pair,bp),可編碼5種基因,人類基因組含3×109bp DNA,理論上可編碼200萬(wàn)以上的基因,然而,由于哺乳動(dòng)物的基因含有內(nèi)含子(intorn),因而每個(gè)基因可長(zhǎng)達(dá)5000~8000bp,少數(shù)可達(dá)20,000bp。按這樣大小的基因進(jìn)行推算,人類基因組相當(dāng)于40~60萬(wàn)個(gè)基因。這可能嗎?雖然現(xiàn)在還不知道確切數(shù)字,但利用核酸雜交已測(cè)得哺乳類細(xì)胞含50,000~100,000種mRNA,由此推論整個(gè)基因組所含基因不會(huì)超過10萬(wàn)個(gè),只占全部基因組的6%,另外5~10%為rRNA等重復(fù)基因,其余80~90%屬于非編碼區(qū),沒有直接的遺傳學(xué)功能。DNA的復(fù)性動(dòng)力學(xué)研究發(fā)現(xiàn)這些非編碼區(qū)往往都是一些大量的重復(fù)序列,這些重復(fù)序列或集中成簇,或分散在基因之間,可能在DNA復(fù)制、調(diào)控中具有重要意義,并與生物進(jìn)化、種族特異性有關(guān)。可見原核細(xì)胞由于DNA分子較小,必須充分利用有限的核苷酸序列,這是真核基因組與原核基因組顯然不同之處。
真核基因組與原核基因組在結(jié)構(gòu)上還有很多不同的特點(diǎn),歸納如下:
1.真核生物基因組結(jié)構(gòu)特點(diǎn)
、僬婧松锘蚪MDNA與蛋白質(zhì)結(jié)合形成染色體,儲(chǔ)存于細(xì)胞核內(nèi),除配子細(xì)胞外,體細(xì)胞內(nèi)的基因組是雙份的(即雙倍體,diploid),即有兩份同源的基因組。
、谡婧思(xì)胞基因轉(zhuǎn)錄產(chǎn)物為單順反子(monocistron),即一個(gè)結(jié)構(gòu)基因轉(zhuǎn)錄、翻譯成一個(gè)mRNA分子,一條多肽鏈。
、鄞嬖诖罅恐貜(fù)序列,即在整個(gè)DNA中有許多重復(fù)出現(xiàn)的核苷酸順序,重復(fù)序列長(zhǎng)度可長(zhǎng)可短,短的僅含兩個(gè)核苷酸,長(zhǎng)的多達(dá)數(shù)百、乃至上千。重復(fù)頻率也不盡相同;高度重復(fù)序列重復(fù)頻率可達(dá)106次,包括衛(wèi)星DNA、反向重復(fù)序列和較復(fù)雜的重復(fù)單位組成的重復(fù)序列;中度重復(fù)序列可達(dá)103~104次,如為數(shù)眾多的Alu家族序列,KpnI家族,Hinf家族序列,以及一些編碼區(qū)序列如rRNA基因、tRNA基因、組蛋白基因等;單拷貝或低度重復(fù)序列,指在整個(gè)基因組中只出現(xiàn)一次或很少幾次的核苷酸序列,主要是編碼蛋白質(zhì)的結(jié)構(gòu)基因,在人基因組中占約60~65%,因此所含信息量最大。
、芑蚪M中不編碼的區(qū)域多于編碼區(qū)域。
、莼蚴遣贿B續(xù)的,在真核生物結(jié)構(gòu)基因的內(nèi)部存在許多不編碼蛋白質(zhì)的間隔序列(intervening sequences),稱為內(nèi)含子(intron),編碼區(qū)則稱為外顯子(exon)。內(nèi)含子與外顯子相間排列,轉(zhuǎn)錄時(shí)一起被轉(zhuǎn)錄下來,然后RNA中的內(nèi)含子被切掉,外顯子連接在一起成為成熟的mRNA,作為指導(dǎo)蛋白質(zhì)合成的模板。
⑥基因組遠(yuǎn)大于原核生物的基因組,具有許多復(fù)制起點(diǎn),而每個(gè)復(fù)制子的長(zhǎng)度較小。