說起“巨無霸”,你最先想到的是什么?
是漢堡中的銷量王者?《變形金剛》中力大無比的機(jī)器人?還是世界上體型最大的生物,比如重達(dá)180噸的藍(lán)鯨和高達(dá)115米的北美紅杉?
今天要講的這位,雖然外表平平無奇,卻在近日成為真核生物界新晉的基因組“巨無霸”,它就是來自梅溪蕨屬(Tmesipteris)的T. oblanceolata(為方便閱讀,下文簡(jiǎn)稱其為“梅溪蕨”,種加詞oblanceolata指“倒披針形的”)
這一稱號(hào)實(shí)至名歸,因?yàn)槊废У幕蚪M大小達(dá)到了驚人的160.45 Gb!它同時(shí)打破了三項(xiàng)世界紀(jì)錄——“最大的蕨類植物基因組”、“最大的植物基因組”和“最大的基因組”。此前,后兩項(xiàng)紀(jì)錄一直由基因組大小為148.89 Gb的日本重樓(Paris japonica)自2010年起保持著。
“160.45 Gb”是個(gè)什么概念呢?
這還得從什么是基因組,基因組的大小及其如何衡量說起。
新一屆“巨無霸”T. oblanceolata植株
(圖片來源:Fernández et al., 2024)
上一屆“巨無霸”日本重樓植株
(圖片來源:PPBC-吳寶成;Alpsake/Wikimedia Commons)
基因組有兩個(gè)層面的含義:在物種水平上,基因組指某一物種所有個(gè)體極度相似但略有差異的遺傳信息;而在個(gè)體水平上,基因組指存在于某一個(gè)生物體內(nèi)所有細(xì)胞中的遺傳物質(zhì)的總和,包括DNA或RNA(部分病毒)。
在生命的宏偉詩(shī)篇中,DNA是那神秘的編織者,用四種基礎(chǔ)的字母——腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)和鳥嘌呤(G)編織出無盡的遺傳密碼。正如多米諾骨牌一般,每一塊骨牌的倒下都引發(fā)連鎖反應(yīng),這些堿基的排列組合,決定了生物的多樣性,讓每一個(gè)生命體都擁有其獨(dú)特的遺傳藍(lán)圖。
那么,我們?nèi)绾魏饬窟z傳信息有“多少”呢?
一般來說,衡量一個(gè)生物的遺傳信息有三種方式:
(1)以重量計(jì)算的C值,單位通常是皮克(10-12克,pg);
(2)以分子量計(jì)算,單位為道爾頓;
(3)以核苷酸堿基(ATCGU)對(duì)的數(shù)量表示。
以核苷酸堿基對(duì)的數(shù)量來表示是衡量基因組大小最常用的方法。
和計(jì)算機(jī)存儲(chǔ)容量單位類似,我們將一個(gè)堿基對(duì)的“容量”定為1 bp(base pair),如果將堿基對(duì)連接起來,一千個(gè)為1 Kb,一百萬個(gè)為1 Mb,十億個(gè)則為1 Gb。但與計(jì)算機(jī)存儲(chǔ)容量不同的是,計(jì)算機(jī)存儲(chǔ)大小的進(jìn)率是1024,而基因組大小的進(jìn)率是1000。
那么如何測(cè)定一個(gè)物種的基因組大小呢?目前,我們可以通過流式細(xì)胞術(shù)、K-mer分析法和基因組從頭測(cè)序的方法來估算,這三種方法在評(píng)估基因組大小的精確度上依次提高,但相應(yīng)的,它們的技術(shù)難度、準(zhǔn)確度和成本也隨之增加。
隨著三代測(cè)序技術(shù)的迅猛發(fā)展,基因組測(cè)序的成本已經(jīng)顯著降低,如今完成一個(gè)1 Gb基因組的深度測(cè)序、組裝及注釋的價(jià)格已經(jīng)降至10萬元內(nèi)了。然而,即便成本大幅下降,對(duì)于160 Gb的梅溪蕨基因組這樣龐大的項(xiàng)目,其高昂的費(fèi)用仍然只有少數(shù)財(cái)力雄厚的“土豪”團(tuán)隊(duì)能夠承擔(dān)。
再者,三代測(cè)序組裝基因組前一般會(huì)用流式細(xì)胞術(shù)或K-mer法對(duì)基因組大小進(jìn)行“摸底”。于是,在這項(xiàng)研究中,科研人員首先安排上了較為“經(jīng)濟(jì)實(shí)惠”的流式細(xì)胞術(shù)估算梅溪蕨基因組大小。
流式細(xì)胞術(shù)的原理是通過制備細(xì)胞核懸浮液,對(duì)核酸進(jìn)行熒光染色,并使用已知基因組大小的物種作為參考,根據(jù)兩個(gè)物種間相對(duì)熒光密度(DNA含量)峰值的橫坐標(biāo),對(duì)基因組大小進(jìn)行等比例計(jì)算。
如下圖所示,梅溪蕨和基因組大小為148.89 Gb的日本重樓的峰值橫坐標(biāo)的比值為1.12(226.60/202.28),說明梅溪蕨的基因組大小約為日本重樓的1.12倍!這項(xiàng)研究同時(shí)使用了洋蔥、貝母屬Fritillaria lusitanica和日本重樓作為內(nèi)參,最終估算的梅溪蕨基因組大小為160.45 ±0.81 Gb。
梅溪蕨與日本重樓的流式細(xì)胞結(jié)果
(圖片來源:Fernández et al., 2024)
盡管梅溪蕨擁有“巨型”基因組,但其植株看起來卻相當(dāng)迷你且不起眼。
梅溪蕨屬是松葉蕨科(Psilotaceae)下的一個(gè)小屬,包含15個(gè)種,其中12種都具有附生屬性。
本文的主角T. oblanceolata梅溪蕨比較罕見,它在西南太平洋的新喀里多尼亞島及一些鄰近島嶼上被發(fā)現(xiàn),株高最多15 cm。梅溪蕨屬不僅植株迷你,也是科學(xué)家眼中很小眾的類群,到目前為止,該屬中只報(bào)道了兩個(gè)物種的基因組大小,即四倍體T. tannensis(73.19 Gb)和八倍體T. obliqua(147.29 Gb),這兩者都擁有巨型基因組。
本研究通訊作者Jaume Pellicer教授在調(diào)查附生梅溪蕨的生境
(圖片來源:Oriane Hidalgo)
來自邱園的植物學(xué)家Ilia J. Leitch教授是這項(xiàng)研究的參與者之一,她用了一個(gè)形象的比喻來描述梅溪蕨的基因組大得有多夸張——如果把其細(xì)胞內(nèi)纏繞折疊的DNA像抽絲一樣展開,長(zhǎng)度可超過100米,相比之下,人類基因組大約為3.1 Gb,展開后每個(gè)細(xì)胞中的DNA長(zhǎng)度僅為2米左右!如果按照字母和漢字的大小比例,將兩對(duì)堿基算一個(gè)字節(jié),梅溪蕨的基因組可以寫下11萬本《紅樓夢(mèng)》(73.1萬字/本),相當(dāng)于一個(gè)圖書館的藏書量了!
那么,基因組大小和生物體大小之間是否有某種關(guān)聯(lián)?對(duì)一個(gè)物種來說,基因組越大越好嗎?
其實(shí),著名的“C值悖論”已經(jīng)回答了第一個(gè)問題,該理論提出物種的基因組大?。–值)和它進(jìn)化的復(fù)雜性之間是沒有嚴(yán)格的對(duì)應(yīng)關(guān)系的,基因組大小和生物體大小就更沒有關(guān)系啦。
而且與人們?cè)O(shè)想的不同,擁有更大的基因組通常并不是一種優(yōu)勢(shì)。這是因?yàn)?,基因組越大,合成的DNA就越多,需要的能量和營(yíng)養(yǎng)物質(zhì)也越多,同時(shí),在每次細(xì)胞分裂時(shí)復(fù)制基因組的能量需求也越高。
以植物為例,擁有大量DNA的通常都是那些生長(zhǎng)緩慢的多年生植物,它們的光合作用效率較低,并且需要更多的營(yíng)養(yǎng)物質(zhì)才能生長(zhǎng),繁殖和產(chǎn)生后代更緩慢,適應(yīng)環(huán)境也可能更緩慢。
Ilia J. Leitch教授認(rèn)為,想要管理好如此龐大的遺傳信息,就像“試圖在擁有數(shù)百萬本書的圖書館中,找到幾本有關(guān)如何在如此龐大的DNA中生存的指導(dǎo)書”一樣荒謬,畢竟基因組中,僅有很小一部分的DNA由編碼蛋白質(zhì)的基因組成。
那么,擁有如此龐大基因組的梅溪蕨是如何存活下來的呢?它又是如何管理基因組中復(fù)雜的遺傳信息的呢?
我們首先要搞明白梅溪蕨如此龐大的基因組從何而來。
植物的基因組大小具有驚人的差異性,目前已知基因組最小的植物是貍藻科的一種食蟲植物——旋刺草(Genlisea aurea),它的基因組大小只有0.0636 Gb,因?yàn)槊废У募尤?,使得植物基因組大小的變化范圍擴(kuò)展到了驚人的2500倍(160.45/0.0636)。
目前的研究認(rèn)為,基因組大小的變化主要由兩類因素驅(qū)動(dòng)。
1.基因組多倍化
指某物種通過染色體倍增的方式導(dǎo)致多套染色體共存于同一細(xì)胞核中,形成穩(wěn)定遺傳的新物種的現(xiàn)象。這就類似于多倍體同時(shí)點(diǎn)了好幾份基因組的“豪華套餐”,例如稻屬中,基因組分別為400 Mb和600 Mb左右的二倍體斑點(diǎn)野生稻和藥用野生稻雜交并多倍化后,產(chǎn)生了異源四倍體小粒野生稻,其基因組達(dá)到1Gb。
2.重復(fù)序列的擴(kuò)張
基因組中重復(fù)出現(xiàn)的DNA序列叫做重復(fù)序列,例如轉(zhuǎn)座子(一類能夠在染色體上自主復(fù)制和位移的DNA序列)。由于許多類型的轉(zhuǎn)座子不具備基因編碼能力,因此曾被叫做“垃圾序列”。然而,隨著科學(xué)的發(fā)展和研究的深入,科學(xué)家也發(fā)現(xiàn),重復(fù)序列不僅是大型植物基因組的重要組成部分,也是基因組進(jìn)化的重要驅(qū)動(dòng)因素。
以寄生生物為例,一般來說,它們?yōu)榱藴p少自身負(fù)荷和能耗,會(huì)盡可能讓基因組精簡(jiǎn),但寄生花卻擁有3.5 Gb的大型基因組,其中就有高達(dá)90%的序列由高度重復(fù)的轉(zhuǎn)座子組成。盡管它的基因組看起來十分“巨無霸”,但事實(shí)上大部分基因的結(jié)構(gòu)都非常簡(jiǎn)單,且基因丟失數(shù)量極高,是名副其實(shí)的“虛胖型選手”。
雖然梅溪蕨的基因組還未被解析,細(xì)胞學(xué)數(shù)據(jù)也暫未被收集到,我們暫不清楚蕨類植物是如何應(yīng)對(duì)如此不必要的巨型基因組帶來的后果的。但是,科學(xué)家們猜測(cè),梅溪蕨的基因組“巨無霸”套餐是這樣定制的:多倍體身份or“虛胖”的冗余序列?它才不做選擇,全都要了!
>>多倍體身份
相較于被子植物,蕨類植物的細(xì)胞中通常擁有較高的染色體數(shù)目,這種現(xiàn)象也被稱為“染色體囤積綜合征”,梅溪蕨屬的單套染色體組中的染色體基數(shù)就達(dá)到了x = 52。此外,現(xiàn)有證據(jù)發(fā)現(xiàn)梅溪蕨屬內(nèi)不乏四倍體、八倍體等,這簡(jiǎn)直buff疊滿了呀!
>>高度重復(fù)的序列
研究者們推測(cè),梅溪蕨屬多個(gè)物種的巨型基因組可能與其“附生”的屬性有關(guān),或許與擁有“寄生”屬性的寄生花相似,其基因組中也存在高度冗余的重復(fù)序列。
此外,根據(jù)以往大型基因組的研究案例,我們也可以大膽推測(cè):梅溪蕨基因組中或許存在一些高度擴(kuò)張的基因家族,對(duì)其適應(yīng)環(huán)境有著重要作用;梅溪蕨基因組中或許也發(fā)生了大量的基因丟失事件,只有少量控制關(guān)鍵性狀的基因得以保留,這些基因或許是梅溪蕨成功管理其巨型基因組的關(guān)鍵;梅溪蕨現(xiàn)有群體如此小,是否曾經(jīng)歷了瓶頸效應(yīng),使其遺傳多樣性降低,積累了大量有害突變,這個(gè)物種未來是否會(huì)面臨生存的危機(jī),是否需要采取保護(hù)措施......當(dāng)然,這一切問題的答案,還是坐等“土豪”團(tuán)隊(duì)解析完基因組后,由進(jìn)化生物學(xué)家來揭曉吧。
除了本文的主角,自然界中其實(shí)還擁有不少基因組大小超過100 Gb的生物,比如植物中的梅溪蕨屬、日本重樓、延齡草屬、白果槲寄生,動(dòng)物中的各種肺魚和泥螈。雖然這些生物中,有的能跑能跳能劃水,有的扎根土壤吸收日月精華;有的顏值極高,有的其貌不揚(yáng);有的“身強(qiáng)力壯”,有的弱不禁風(fēng)......但它們都有一個(gè)共同的名字——基因組“巨無霸”!
已知基因組大小超過100 Gb的生物
(圖片漢化自:Fernández et al., 2024)
審核 | 李鹍鵬
我也說兩句 |
版權(quán)聲明: 1.依據(jù)《服務(wù)條款》,本網(wǎng)頁(yè)發(fā)布的原創(chuàng)作品,版權(quán)歸發(fā)布者(即注冊(cè)用戶)所有;本網(wǎng)頁(yè)發(fā)布的轉(zhuǎn)載作品,由發(fā)布者按照互聯(lián)網(wǎng)精神進(jìn)行分享,遵守相關(guān)法律法規(guī),無商業(yè)獲利行為,無版權(quán)糾紛。 2.本網(wǎng)頁(yè)是第三方信息存儲(chǔ)空間,阿酷公司是網(wǎng)絡(luò)服務(wù)提供者,服務(wù)對(duì)象為注冊(cè)用戶。該項(xiàng)服務(wù)免費(fèi),阿酷公司不向注冊(cè)用戶收取任何費(fèi)用。 名稱:阿酷(北京)科技發(fā)展有限公司 聯(lián)系人:李女士,QQ468780427 網(wǎng)絡(luò)地址:www.arkoo.com 3.本網(wǎng)頁(yè)參與各方的所有行為,完全遵守《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》。如有侵權(quán)行為,請(qǐng)權(quán)利人通知阿酷公司,阿酷公司將根據(jù)本條例第二十二條規(guī)定刪除侵權(quán)作品。 |