經典的遺傳學研究方法
遺傳圖譜是依據染色體交換與重組,以多態性的遺傳標記為路標,以標記間的重組率為“圖距”,
確定不同多態性標記位點在每條連鎖群上排列的順序和遺傳距離的線性連鎖圖譜
應用領域
針對性的個性化方案
?從物種個體取樣到候選基因挖掘,我們將為您提供一站式個性化解決方案,讓分析過程快速、科學、清晰!
分析內容
測序數據下機后,每一個分析過程我們都嚴格把控,針對不同的測序方式,從數據質控到遺傳圖譜的構建,有專門的的流程進行分析。
全基因組重測序 |
測序數據質控 |
與參考基因組比對 |
變異檢測及注釋 |
多態標記開發 |
遺傳圖譜構建及評估 |
簡化基因組測序(SLAF) |
測序數據質控 |
與參考基因組比對(有參) |
標簽聚類比對(無參) |
SNP變異檢測及注釋 |
多態標記開發 |
遺傳圖譜構建及評估 |
SLAF簡化遺傳圖譜
SLAF-seq技術是百邁客公司自主研發的一套基于酶切的簡化基因組測序策略,
不受參考基因組限制,能夠有效地降低物種基因組復雜度,
SLAF標簽構建遺傳圖譜具有上圖標記數量多、圖譜質量高、周期短、數據利用率高等的優點。
重測序遺傳圖譜
對已有參考基因組序列的物種進行群體全基因組重測序,利用高性能計算平臺和生物信息學方法,
檢測單核苷酸多態性位點(SNP),并計算多態性標記間的遺傳連鎖距離,
繪制高密度的遺傳圖譜, 在進行QTL定位中,可直接獲取定位區間內的序列信息,加快功能基因的鑒定和驗證的進度
百邁客優勢
自主知識產權簡化基因組測序技術SLAF-seq
專門針對高通量測序開發的HighMap作圖軟件
豐富的項目經驗,已完成百余個物種超過近千張高密度遺傳圖譜
截止目前已發表SCI文章200+篇,累計影響因子700+
公司擁有 40 余項專利技術和 150 余項軟件著作權,為分析結果保駕護航
成功案例
測序數據統計與評估
高質量的測序數據是進行后續分析的重要基礎,在獲得測序的Raw data后,我們將會進行測序數據產出統計、堿基測序質量分布、堿基類型分布等多種測序評估方式,保證測序數據的準確性。
#Chr | Pos | Ref | R01 | R02 | … |
Chr1 | 113342 | A | G | A | … |
Chr1 | 163871 | A | G | A | … |
Chr1 | 232230 | A | A | G | … |
Chr1 | 232330 | C | C | A | … |
Chr1 | 232546 | T | T | C | … |
群體遺傳變異檢測
SNP(Single Nucleotide Polymorphism)及InDel(Insertion-Deletion)是基因組上最為常見的遺傳標記,具有數量多、多態性豐富的特點,SNP和InDel的檢測主要通過GATK和samtools軟件工具包實現。變異位點注釋使用SnpEff軟件。
多態標記開發
在變異位點檢測的基礎上,開發親本間的多態性標記,并對子代中這些多態性標記進行基因型分型。
遺傳圖譜構建
為保證遺傳圖譜質量,對子代中多態性標記進行嚴格的篩選過濾,包括親本深度過濾、異常位點過濾、標記完整度過濾及偏分離標記過濾等,獲得高質量標記。利用百邁客自主研發的Highmap-map軟件進行高密度遺傳圖譜的繪制。
遺傳圖譜評估
為了保證遺傳圖譜的質量,百邁客采用了目前最為嚴格的圖譜評價體系,包括上圖標記完整度統計、單體來源評估、連鎖關系評估、遺傳圖譜共線性分析等。
根據親本雜合、純合情況選擇分離群體類型:
(一)親本雜合的物種,如林木、水產、果樹等異花授粉、蟲媒、風媒授粉、雌雄異體物種,一般采用F1。
(二)親本純合物種,如水稻、豆類等自花授粉,分離群體可用F2、BC、RIL、DH、巢式群體等。
兩個親本推10-20×,子代測序深度看物種基因組組裝程度,如果組裝結果不好的話,大部分片段都比較短,可能最后會影響遺傳圖譜的結果,推薦測序深度3X以上,如果基因組裝到染色體水平或者N50達到Mb級別測1×就可以了。
需要,9311基因組雖然出來,但是9311有很多不同類型的突變,比如有的有芒,有的無芒,建議老師測,但是測序深度可以稍微降低。
大部分QTL定位方法只是要求表型數據中的隨機誤差項服從正態分布,并沒有要求表型數據滿足正態分布。數量性狀只有在多基因假說下才真正符合正態分布,表型數據的非正態性并不影響QTL定位。
包含偏分離不顯著的標記,顯著偏分離的標記會被過濾掉。偏分離是自然界非常普遍存在的現象,并被認為是生物進化的動力之一。產生偏分離的原因主要有兩個方面:配子選擇和合子選擇,其中配子選擇主要包括花粉致死、花粉管競爭和選擇性受精。除了上述原因以外,環境因素、非同源重組、基因轉換、轉座因子、轉基因沉默、體外孤雄生殖過程中的選擇壓、非整倍體或不穩定易位造成的染色體不穩定等都有可能是導致偏分離。
通過共線性分析,將遺傳圖譜上的標記與初步組裝得到的scaffold進行比對,統計不同scaffold上的標記數目,得到不同連鎖群上被錨定的scaffold信息,一個scaffold上如果錨定兩個以上的標記,該scaffold的位置和方向均可以被定位到染色體水平。只有1個標記則只能定位到位置,方向不能確定。如果沒有錨定到標記,則該scaffold仍然不能被定位到染色體水平,說明該scaffold多態性可能較差,需要構建更加精細的遺傳圖譜。
判斷標記是否偏分離是采用的卡方檢驗,卡方檢驗的顯著性P值越小,越證明該標記偏分離嚴重,因此P值小于0.001的標記要少于P值小于0.01的標記的數量。在進行過濾的時候如果按照P值<0.001過濾,剩余的標記會更多,因此是比較寬松的過濾標準,反之,按照P值<0.01過濾,會過濾掉更多的標記,是更為嚴格的過濾標準。
取F2的葉片,F2:3家系的表型平均值作為F2的表型,群體要隨機取樣(F2:3家系是指F2代群體中,每個F2代植株自交又產生的各自的F3群體組成的群體,這個F3是與上一代F2所對應的,所以也稱為F2:3家系,他們是不能混在一起的,混在一起就叫F3了,而不是F2:3。這種群體主要是用于初步定位的,對于單顯性基因控制的質量性狀定位效果很好。)
無需建立BAC庫,親本重測序可以獲得QTL區域的基因序列,進行基因預測和后續標記開發轉基因驗證等工作。
1)表達數量性狀基因座(expression Quantitative Trait Loci,eQTL)是指的是染色體上一些能特定調控mRNA和蛋白質表達水平的區域,其mRNA/蛋白質的表達水平量與數量性狀成比例關系,將各基因型的表達數據作為一個數量性狀,利用傳統的QTL分析方法進行分析。eQTL可分為順式作用eQTL和反式作用eQTL,順式作用eQTL就是某個基因的eQTL定位到該基因所在的基因組區域,表明可能是該基因本身的差別引起的mRNA水平變化;反式作用eQTL是指某個基因的eQTL定位到其他基因組區域,表明其他基因的差別控制該基因mRNA水平的差異。
2)基于轉錄組測序的關聯分析是從SNP關聯分析與GEM關聯分析兩個水平實現的,開發的SNP位于基因編碼區域,SNP與基因(或Unigene)所屬關系是已知,加上基因表達水平的關聯分析就能夠實現功能基因的精細定位。
主要有四款:R-qtl、MapQTL、WinQTLcart和ICiMapping。
這是由于標記的子代分型依賴于親本的分型造成的。遺傳圖中每一個標記的子代分型首先要根據親本的分型來進行分型判斷,因此親本分型的準確性就很重要,是依靠高深度的測序來確保親本分型的準確性,因此在測序的時候要比子代的測得多。