ONT測序是新一代基于納米孔的單分子實時電信號測序技術,其各平臺的測序原理相同。DNA/RNA鏈在馬達蛋白的帶領下與鑲嵌在生物膜上的納米孔蛋白結合并解螺旋,在生物膜兩側電壓差的作用下,DNA/RNA鏈以一定的速率通過納米孔通道蛋白,由于DNA/RNA鏈上不同堿基化學性質存在差異,所以當單個堿基或DNA/RNA分子通過納米孔通道時,會引起不同電學信號的變化。通過對這些信號進行檢測及對應,即可計算獲得相應堿基的類型,完成序列的實時測定。
Nanopore的堿基判讀是依據其電流信號而產生,因此其判定過程比較復雜。目前Nanopore根據電流的大小及電流大小的變化情況,通過“遞歸神經網絡(Recurrent Neural Network)”的復雜算法對堿基進行判讀。
宏基因組是對環境樣本中(土壤、糞便、腸道、水體等)微生物總DNA進行測序。關注環境微生物的種群結構、進化分析、功能基因;解析微生物功能與環境之間的關系;挖掘和研究特定功能基因及代謝通路。納米孔測序技術能夠對環境樣本進行精確的微生物組分析。并且已經在宏基因組領域廣泛應用。
基于Nanopore測序平臺的宏基因組測序,通過生物信息分析獲得環境中的基因功能信息和物種組成信息。通過基因功能的角度分析環境樣品所具有的功能多樣性;通過物種的角度分析分析環境樣品中含有的物種的多樣性。
含義:分箱、聚類,指從微生物群體序列中將不同個體的序列(reads或contigs等)分離開來的過程。
contig binning在常規宏基因組基礎上,進一步將拼接的contig進行cluster聚類,可實現單菌的組裝以及宏基因組關聯分析(MWAS)分析。
基于宏基因組數據的contig binning分析,可基于宏基因組組裝結果,將組成相似以及豐度分布模式一致的contig劃分到同一物種,并進一步進行單菌的草圖組裝。從而可在基于單菌組裝結果的基礎上進行菌株水平的基因和功能注釋、比較基因組分析、進化分析等。
按照Oxford Nanopore Technologies(ONT)公司提供的標準protocol執行,包括樣品質量檢測、文庫構建、文庫質量檢測和文庫測序等流程,主要包括如下步驟:
1、提取高質量基因組DNA,利用Nanodrop、Qubit和0.35%瓊脂糖凝膠電泳進行純度、濃度和完整性質檢;
2、BluePippin全自動核酸回收系統回收大片段DNA;
3、文庫構建(SQK-LSK109連接試劑盒);
1) DNA損傷修復和末端修復,磁珠純化;
2) 接頭連接,磁珠純化;
3) Qubit文庫定量。
4、上機測序。
對測序得到的原始reads進行質量控制并過濾得到Clean reads,用于后續生物信息學的分析。對Clean reads進行拼接組裝、預測編碼基因,并對編碼基因進行通用數據庫和專用數據庫的功能注釋;同時,對Clean reads進行分類學分析,統計樣品物種組成和豐度信息。
使用diamond軟件將質控后的高質量測序數據比對到 nr數據庫,得到樣品的物種組成和相對豐度信息。
CARD是一個持續更新的抗生素抗性相關信息的數據庫。 使用CARD數據庫中的工具軟件rgi將非冗余基因的蛋白序列分別數據庫進行比對,找出比對上的數據庫中對應序列,并得到對應的抗性基因和抗性相關信息。
將預測到的非冗余基因與Nr、GO、COG和KEGG數據庫比對,獲得基因功能注釋信息,了解環境中微生物潛在的生物學功能。
CAZy是碳水化合物酶相關的專業數據庫,內容包括能催化碳水化合物降解、修飾、以及生物合成的相關酶系家族。
通過比較不同環境下微生物基因的豐度,尋找不同環境下存在的差異基因并對這些差異基因做功能富集分析,研究微生物對不同環境的響應機制。
平均讀長>10Kbp,最長可達2M左右;直接跨越重復序列、高度多態性區域等特殊區域;無需PCR擴增;避免PCR擴增引入的錯誤;攜帶甲基化信息;Contig N50平均可達100Kbp,較二代平均提升100倍;可以繞過培養,通過Binning等方法,獲得部分中高豐度的細菌、古菌、病毒等的基因組完整圖或近完整圖
binning含義是分箱、聚類,指從微生物群體序列中將 不同個體的序列(reads或contigs等)分離開來的過 程。簡單來說就是把宏基因組數據中來自同一菌株的 序列聚到一起,得到一個菌株的基因組。可獲得環境樣本中,不可分離培養的單菌基因 組草圖,結合三代測序,甚至可獲得單菌完成圖,基 于基因結構和功能注釋,可進一步進行數據挖掘