分類: 基因組測序

基因組(Denovo sequencing),即基因組從頭測序,指在不依賴參考基因組的情況下繪制該物種的全基因組序列圖譜,從而獲取該物種的全部遺傳信息。高連續性基因組的獲得,對后續功能基因定位,結構變異檢測具有重要的意義。結合近幾年的文章我們不難發現,基因組研究主要以下面幾種方向為出發點開展:

1)大型/多倍體/超復雜物種基因組破譯,技術創新改革;

2)0 Gap基因組/單體型基因組構建,序列優化打磨;

3)未知基因組破譯聯合多組學分析,經濟價值挖掘;

4)品種泛基因組構建解析功能變異,覆蓋多樣表型;

5)科屬水平譜系基因組構建與分析,探索進化功能;

6)多種基因組聯合多組學比對剖析,解析性狀特征。 … …

前5種好理解,第6種方向能做什么呢?其實我們想要了解一個物種,往往單一基因組難以完整解析,例如該物種不同性別如何引起性狀差異?性別決定基因在哪里?例如表型明顯差異的種質間的基因有哪些異同?例如兩個物種表型相似但分類水平卻存在爭議?例如多倍體物種的演化歷程模糊?等等棘手但是卻又熱門的研究話題。

接下來小編將通過百邁客最近三篇動植物上的成功案例帶大家看看,如何通過數個材料基因組結合多組學的手段解析性狀特征。

案例一

合作單位:中科院南海海洋研究所

發表期刊:Science Advances

影響因子:14.131

發表時間:2021.08

研究材料:

Denovo: 雌性與雄性草海龍(Phyllopteryx taeniolatus);雌性與雄性綠海龍(Syngnathoides biaculeatus)

個體重測序:2只雄性草海龍

RNA-seq:腦、眼、鰓、肝、腸、肌肉、鰭、皮膚和附葉

測序方案

Denovo:雌性、雄性草海龍與雄性綠海龍PacBio平臺;雌性綠海龍Nanopore平臺,雌性、雄性草海龍與雄性綠海龍進行Hi-C測序。三代測序技術對應測序數據如下表所示:

個體重測序:~30X PacBio

研究內容

1.兩種海龍基因組組裝與進化關系

草海龍最終組裝大小為 ~659 Mb(♂)與 ~663 Mb(♀), contig N50分別為10.0 Mb與12.1 Mb。綠海龍分別組裝~637 Mb(♂)與~648 Mb(♀),contig N50分別為18.0Mb與21.0 Mb。4個基因組BUSCO評估顯示范圍在94.00- 94.40%。并分別在草海龍和綠海龍中確定了31個和33個發生擴張的基因家族。通過19條鰭魚類全基因組數據集進行系統發育分析,明確草海龍與綠海龍在系統發育地位上屬于海龍亞科(Syngnathinae)的姊妹群,并于27.3 百萬年前左右發生分化。

2.“附葉”相關基因研究

草海龍的頭部、頸部、腹部、背部和尾部區域有葉子狀的附屬物,可以與周圍環境相融合,使草海龍以完美擬態隱匿于海草床中。這些結構是該物種的一種適應性進化產物,主要由骨基質和富含膠原纖維的結締組織組成。通過轉錄組學分析,發現其表達基因(如msx, dlx, fgf)主要從皮膚和鰭等器官募集而來,暗示了相關基因對新器官產生和維持的重要作用。而“附葉”與鰭相比缺乏肢體發育特異性的hox基因。草海龍的附葉在捕食者的襲擊中經常受到損傷,為了研究相關機制,作者通過轉錄組分析研究發現在其附葉中炎癥和損傷修復相關基因表現出高表達水平,說明這些基因可能與其附葉的快速愈合和再生能力相關。同時草海龍特異性擴張的MHC I基因也在附葉中顯著高表達,能為其提供額外的免疫保護。

圖1 草海龍附葉形態及關鍵基因表達特征

3.性別決定位點分析

通過雄性和雌性葉海龍Illumina reads正反比對雄性和雌性的全基因組序列,來確定葉海龍中假定的性染色體和性別基因座。結果顯示Chr4上的一個~47-kb區域僅在雄性中存在, 且reads覆蓋度為Chr4平均值的一半,該片段經Hi-C互作分析結果支持。注釋及比較分析發現草海龍和綠海龍的性別決定基因均為amhr2的雄性特異性拷貝amhr2y,但兩者的基因座不相同。系統發育分析表明,amhr2y起源于它們最近共同祖先的重復事件,而黃鱸amhr2y是從其譜系中的獨立重復事件進化而來。研究發現amhr2y比amhr2受到的選擇壓力更強,其整體結構與amhr2相似。

圖2 草海龍與綠海龍性別決定基因進化

4.無牙研究

草海龍與其他海龍科物種一樣具有缺乏牙齒的管狀吻。研究表明,大部分富含 P/Q 的分泌型鈣結合磷蛋白(SCPP)基因的缺失可能是導致syngnathids無牙的原因。為了驗證海龍科中因假基因化喪失功能這一點,作者使用CRISPR-Cas9技術構建了兩個斑馬魚scpp5突變系,發現scpp5-/-突變體斑馬魚牙齒的數量減少且頜骨中存在用于附著牙齒的凹坑。

研究結論

該研究通過雌雄性海龍基因組的破譯,結合重測序分析、轉錄分析、比較基因組分析等研究揭示了海龍科物種性別決定基因的產生和演化歷程,為海洋魚類的環境適應性進化研究提供了重要理論依據。

案例二

合作單位:浙江大學

發表期刊:Plant Biotechnology Journal

影響因子:9.801

發表時間:2021.08

研究材料:

Denovo:Brassica juncea菜用芥菜T84-66、油用芥菜AU213;

個體重測序:12個油菜品種;

遺傳進化:183份油用與菜用芥菜;

測序方案

Denovo:菜用芥菜分別146 Gb Illumina(~150X)+ 251 Gb PacBio(~200X)+Hi-C(~200X );油用芥菜147 Gb Illumina(~150X)+205 Gb PacBio(~200X)+Hi-C(~200X )

個體重測序:~20X Nanopore

遺傳進化與GWAS:~10X illumina

研究內容

1.菜用芥菜T84-66與油用芥菜AU213基因組Denovo

本研究在首次完成榨菜基因組組裝基礎上(Nature Genetics,2016 【項目文章】NG芥菜基因組文章解讀),進一步優化與解析低硫苷油用芥菜變種AU213的染色體水平基因組。調研圖評估菜用與油用芥菜大小結果分別為968 Mb與938 Mb,且contigN50分別為3.36 Mb及4.4 Mb,最大的scaffold近乎跨越了完整的染色體序列。T84-66與AU213基因組BUSCO(97.7 %與98.3%)、CEGMA(99.6 %與99.8 %)、二代數據回比(97.12 %與96.18 %)、GOGGs驗證以及與前期基因組版本比較等方式,共同表明本次基因組組裝的高完整性。兩種芥菜中分別預測了100,829及100,048個基因,與16年已發表的 T84-66 (V1) 版本相比有所增加。芥菜型油菜的Hi-C圖譜顯示常染色質(A)和異染色質(B)的分布對比顯示,在著絲粒附近的異染色質狀態中具有相對較低的基因表達模式。

圖1 芥菜表型與基因組特征以及三維基因特征

2.結構變異研究

系統地鑒定了T84-66 和 AU213 的A和B亞基因組中的全基因組單核苷酸多態性 (SNP)、插入/缺失 (InDels)和存在/缺失變異(PAV)。在T84-66和AU213之間的A和B亞基因組中鑒定了24,768個PAV(> 100 bp),其中3,634個PAV導致6,425個基因的變異。隨機選擇了幾個PAV并使用PCR來確保這些PAV的保真度。其中一些基因組變異位于基因區域內,預計會影響T84-66和AU213作物中涉及生物和非生物脅迫的基因功能。

為了破譯芥菜基因組菜用和油用品種之間SVs衍生的功能差異,作者基于Nanopore重測序技術,系統比較了菜用和油用芥菜群體基因組結構變異(structural variation,SV),挖掘到包括1, 354個高可信度的插入、缺失、重復、倒位、易位等變異。其中兩個重要的基因位點TGA1和HSP20在ChrA06和ChrB08,可能與B.juncea基因組的菜用與油用品種之間對生物和生物應力的反應的自然變異有關。這些變異研究為菜用芥和油用芥兩個典型分化群體的演化提供了基因組變異基礎。

3.群體進化與GWAS分析

使用T84-66作為參考基因組,對183份油用與菜用芥菜進行進化關系分析,并通過SGS-GWAS(scored genomic SNPs based GWAS)基因定位,在A02和A09中發現了兩個參與控制芥菜硫苷(GSL)積累變異的關鍵遺傳位,并首次發現A09中的MYB28與B. jucnea中GSL的積累有關。經過進一步研究并同過ONT驗證發現,MYB28基因的拷貝數變異(copy number variations,CNVs)是導致芥菜種群中硫苷積累差異的原因,該基因的拷貝數變異在低硫苷芥菜群體中普遍存在。

研究小結

該研究將為多倍基因組進化研究和精確基因組選擇研究提供重要研究信息,對芥菜風味品質和油脂質量的分子遺傳改良具有重要科學和應用價值。

案例三

合作單位:華中農業大學

發表期刊:Molecular Biology And Evolution

影響因子:16.241

發表時間:2021.05

研究材料:

基因組、Hi-C:圓葉棉G. rotundifolium(K2) 、亞洲棉G. arboreum(A2)、雷蒙德氏棉G. raimondii(D2)新鮮葉片

測序方案

denovo:illumina K2、A2和D5分別 108×, 118×, 132×;Nanopore K2、A2和D5分別124×, 131×, 167×

Hi-C掛載:6堿基酶HindⅢ;K2、A2和D5分辨率分別為20kb、20kb、10kb

Hi-C互作:4堿基酶DpnⅡ;分辨率20 Kb, 50 Kb, 100 Kb

研究內容

1.圓葉棉、亞洲棉、雷蒙德氏棉基因組組裝注釋

利用Nanopore測序技術組裝了圓葉棉(K2)基因組,組裝大小為2.44Gb(contigN50 = 5.33 Mb);提升了亞洲棉(A2)和雷蒙德氏棉(D5)的基因組,組裝大小分別為1.62 Gb (contigN50 = 11.69 Mb)和0.75 Gb(contigN50 =17.04 Mb )。Hi-C掛載率均超過99%,BUSCO結果分別為 92.5%, 93.9%,及95.4%。

重復序列注釋表明,相對于D5,K2和A2中棉種特異的反轉錄轉座子擴增是造成這三個基因組大小三倍變化的原因, 特別是Gypsy和DIRS類型。全長轉座子插入時間分析表明K2基因組中轉座子插入最為古老,A2基因組有更多新的轉座子。

圖1 圓葉棉基因組組裝特征

2.比較基因組學和進化

比較基因組分析表明,A2和K2基因組在Chr01與Chr02染色體間存在一個大的易位;K2和D5基因組在Chr13與Chr05染色體間存在一個大的易位。三個棉種在57-71 百萬年前存在一次共同的全基因組復制事件,并在5.1-5.4百萬年前發生物種分化,基因共線性分析表明每個基因組大約有15%特異的基因家族。
3.A/B compartment演化

通過HiC染色質互作數據揭示三個棉種染色體大小的規律,A2與K2比D5多了約7000個基因,三個基因組中17%的共線性同源基因表現為A/B區室的染色質狀態改變,這與活躍的轉座子擴增相關。
K2與A2及與D5相比更多的傾向于A向B的轉化。K2和A2中有更多的基因處于A compartment,D5中有更多的基因處于B compartment。
4.TAD結構演化及轉座子擴增對TAD結構影響研究

大約60%的拓撲結構域(TAD)在三個基因組中發生了重新組織,K2基因組中有更多特異的TAD。基于邊界TE覆蓋度,邊界TE表達以及TE插入時間分析,發現K2不保守的TAD邊界存在特異的和較新的轉座子(物種分化后爆發的TE)插入。這些結果表明最近在K2和A2基因組中表達的TEs的擴增可能有助于在三個物種分化后形成譜系特異性TAD邊界。基于這些結果,作者提出了三個棉種分化過程中,基因組擴張-轉座子擴增介導的A/B 區室轉換和TAD重組的進化模型。

圖2 三種棉TAD特征

研究小結

本次研究首次公布了棉屬中二倍體圓葉棉基因組,并對亞洲棉和雷蒙德氏棉基因組進行了升級,解析了轉座子活動驅動的基因組大小進化特征,從轉座子擴增和染色質空間結構角度為棉花物種進化提供新的見解,為植物中轉座子活動介導的轉錄調控進化研究提供參考。

百邁客2021年基因組成功案例展示

最近文章
a片在线观看网站不卡,A级婬片120秒免费,激情五月综合,欧美一级做a爱高清免费观看