一、真核基因組的復雜性
與原核生物比較,真核生物的基因組更為復雜,可列舉如下:
·真核基因組比原核基因組大得多,大腸桿菌基因組約4×106bp,哺乳類基因組在109bp數(shù)量級,比細菌大千倍;大腸桿菌約有4000個基因,人則約有10萬個基因。
·真核生物主要的遺傳物質與組蛋白等構成染色質,被包裹在核膜內(nèi),核外還有遺傳成分(如線粒體DNA等),這就增加了基因表達調控的層次和復雜性。
·原核生物的基因組基本上是單倍體,而真核基因組是二倍體。
·如前所述,細菌多數(shù)基因按功能相關成串排列,組成操縱元的基因表達調控的單元,共同開啟或關閉,轉錄出多順反子(polycistron)的mRNA;真核生物則是一個結構基因轉錄生成一條mRNA,即mRNA是單順反子(monocistron),基本上沒有操縱元的結構,而真核細胞的許多活性蛋白是由相同和不同的多肽形成的亞基構成的,這就涉及到多個基因協(xié)調表達的問題,真核生物基因協(xié)調表達要比原核生物復雜得多。
·原核基因組的大部分序列都為基因編碼,而核酸雜交等實驗表明:哺乳類基因組中僅約10%的序列為蛋白質、rRNA、tRNA等編碼,其余約90%的序列功能至今還不清楚。
·原核生物的基因為蛋白質編碼的序列絕大多數(shù)是連續(xù)的,而真核生物為蛋白質編碼的基因絕大多數(shù)是不連續(xù)的,即有外顯子(exon)和內(nèi)含子(intron),轉錄后需經(jīng)剪接(splicing)去除內(nèi)含子,才能翻譯獲得完整的蛋白質,這就增加了基因表達調控的環(huán)節(jié)。
·原核基因組中除rRNA、tRNA基因有多個拷貝外,重復序列不多。哺乳動物基因組中則存在大量重復序列(repetitive sequences)。用復性動力學等實驗表明有三類重復序列:①高度重復序列(highly repetitive sequences),這類序列一般較短,長10-300bp,在哺乳類基因組中重復106次左右,占基因組DNA序列總量的10-60%,人的基因組中這類序列約占20%,功能還不明了。②中度重復序列(moderately repetitive sequences),這類序列多數(shù)長100-500bp,重復101-105次,占基因組10-40%。例如哺乳類中含量最多的一種稱為Alu的序列,長約300bp,在哺乳類不同種屬間相似,在基因組中重復3-×105次,在人的基因組中約占7%,功能也還不很清楚。在人的基因組中18S/28SrRNA基因重復280次,5SrRNA基因重復2000次,tRNA基因重復1300次,5種組蛋白的基因串連成簇重復30-40次,這些基因都可歸入中度重復序列范圍。③單拷貝序列(single copy sequences)。這類序列基本上不重復,占哺乳類基因組的50-80%,在人基因組中約占65%。絕大多數(shù)真核生物為蛋白質編碼的基因在單倍體基因組中都不重復,是單拷貝的基因。
從上述可見真核基因組比原核基因組復雜得多,至今人類對真核基因組的認識還很有限,使現(xiàn)在國際上制訂的人基因組研究計劃(human gene project)完成,繪出人全部基因的染色體定位圖,測出人基因組109bp全部DNA序列后,要搞清楚人全部基因的功能及其相互關系,特別是要明了基因表達調控的全部規(guī)律,還需要經(jīng)歷很長期艱巨的研究過程。
二、真核基因表達調控的特點
盡管我們現(xiàn)在對真核基因表達調控知道還不多,但與原核生物比較它具有一些明顯的特點。
(一)真核基因表達調控的環(huán)節(jié)更多
如前所述,基因表達是基因經(jīng)過轉錄、翻譯、產(chǎn)生有生物活性的蛋白質的整個過程。同原核生物一樣,轉錄依然是真核生物基因表達調控的主要環(huán)節(jié)。但真核基因轉錄發(fā)生在細胞核(線粒體基因的轉錄在線粒體內(nèi)),翻譯則多在胞漿,兩個過程是分開的,因此其調控增加了更多的環(huán)節(jié)和復雜性,轉錄后的調控占有了更多的分量。圖19-13扼要地列出真核基因表達的各個可能的環(huán)節(jié)。
圖19-13 真核生物基因表達調控的可能環(huán)節(jié)
圖19-13總結了以前章節(jié)敘述過的基因表達過程,并作了一些新補充。圖中標出了真核細胞在分化過程中會發(fā)生基因重排(gene rearrangement),即胚原性基因組中某些基因會再組合變化形成第二級基因。例如編碼完整抗體蛋白的基因是在淋巴細胞分化發(fā)育過程中,由原來分開的幾百個不同的可變區(qū)基因經(jīng)選擇、組合、變化,與恒定區(qū)基因一起構成穩(wěn)定的、為特定的完整抗體蛋白編碼的可表達的基因。這種基因重排使細胞可能利用幾百個抗體基因的片段,組合變化而產(chǎn)生能編碼達108種不同抗體的基因,其中就有復雜的基因表達調控機理。
此外,真核細胞中還會發(fā)生基因擴增(gene amplification),即基因組中的特定段落在某些情況下會復制產(chǎn)生許多拷貝。最早發(fā)現(xiàn)的是蛙的成熟卵細胞在受精后的發(fā)育過程中其rRNA基因(可稱為rDNA)可擴增2000倍,以后發(fā)現(xiàn)其他動物的卵細胞也有同樣的情況,這很顯然適合了受精后迅速發(fā)育分裂要合成大量蛋白質,需要有大量核糖體。又如MTX(methotrexate)是葉酸的結構類似物,一些哺乳類細胞會對含有利用葉酸所必需的二氫葉酸還原酶(dihydrofolate reductase, DHFR)基因的DNA區(qū)段擴增40?00倍,使DHFR的表達量顯著增加,從而提高對MTX的抗性;虻臄U增無疑能夠大幅度提高基因表達產(chǎn)物的量,但這種調控機理至今還不清楚。