服務熱線02152235399

產品簡介

轉錄組測序(RNA-Seq)的研究對象是特定細胞在某一功能狀態下所能轉錄出來的所有mRNA的總和。新一代高通量測序技術能夠全面快速的獲得某一物種特定組織或器官在某一狀態下的幾乎所有轉錄本序列信息,從而準確地分析基因表達差異、基因結構變異、篩選分子標記(SNPs或SSR)等生命科學重要問題。


A workflow for RNA-seq

Ruairi J, Genomics Research, 2018


我們的優勢

1. 十三年轉錄組測序分析經驗,自主研發了多個生物學領域內認可的算法,如差異可變剪接算法ASD、CASH等,檢出率和準確度超過同類軟件;

2. 不依賴已有物種信息,可研究非模式物種,針對不同平臺的數據,制定多套流程;

3. 烈冰自主搭建轉錄組分析云平臺,一鍵實現數據分析,包括基礎分析和高級數據分析

4. 整合了眾多學術界公認的轉錄組相關數據庫,從本質上提高后期分析的廣度和精度,助力SCI文獻300+,助力研究團隊在Nature發表全球首例自閉癥猴模型



(圖片來源:Liu Z, et al. Nature., 2016)




樣本要求

組織樣品:

1. 動物組織≥1g;

2. 植物組織≥2g;

3. 細胞樣品≥1×106個;

4. 全血≥2mL;

5. 菌體≥106個或≥30mg。

RNA樣品:

1. 樣品需求量: RNA≥10 μg;

2. 樣品濃度:RNA樣品≥100 ng/μl;

3. 樣品純度:OD260/OD280在1.8-2.2之間,OD260/OD230≥2,28S/18S≥1,動物樣品RIN≥7.0,植物樣品RIN≥6.5,RNA無明顯降解。

實驗流程

1. 客戶樣本:保證細胞量在106個以上,否則則需風險建庫;

2. RNA提?。航浀湓噭┖锌焖偬崛》?;

3. RNA質控:凝膠電泳質控→Nanodrop質控→Agilent2200質控;

4. 文庫構建:polyA建庫;

5. 上機測序:烈冰建議選擇NovaSeq測序平臺,雙端測序,通量大,堿基精度高,且成本低,速度快。推薦數據量:6Gb。

數據分析流程




結果示例

1、原始數據質控
以原始數據為研究對象,采用Fastp軟件對于低質量序列,未檢測序列,接頭序列進行過濾,并對于過濾前后數據的堿基質量、GC含量、長度分布、接頭留存和Duplication比率等指標進行分析。圖1中部分展示了raw data質控結果。

堿基質量結果圖

注:左圖橫坐標代表堿基位點,縱坐標代表堿基質量值,不同顏色曲線代表不同堿基在每條read上的質量值;右圖橫坐標代表堿基位點,縱坐標代表堿基含量比值,不同顏色曲線代表不同位點各堿基含量。




2、RNA基因組比對(RNA Mapping)
采用Hisat2/Mapsplice/Star/Tophat2等算法進行基因組比對,得到基因組比對的bam文件,并基于bam文件進行信息統計,得到基因組比對率、reads在基因結構和染色體上的分布結果。圖2部分展示了RNA基因組比對結果。

reads在基因結構和染色體上的分布情況

Miao et al., Mol Cell Endocrinol, 2015

注:左圖為reads在不同基因結構(如外顯子、內含子、基因間區、5’-UTR和3’-UTR)上的分布情況;右圖為reads在染色體上的分布情況,橫坐標表示染色體編號,縱坐標表示百分比,灰色柱子表示每條染色體上堿基數占基因組的比例,綠色柱子表示比對到染色體上reads的堿基數占基因組的比例。




3、表達量統計(Expression)
采用HTSeq以及基因組注釋的gff3文件,根據單端或雙端測序類型,選擇RPKM或FPKM的標化方式對基因表達量進行統計?;诮y計結果,分析得到樣本間相關性、 RPKM/FPKM密度和豐度等分析結果,反映單個樣本基因表達水平分布和離散程度,以及不同樣本整體基因表達水平的差異。

基因表達量分析

注:左圖為不同樣本RPKM密度圖,橫坐標表示log10(RPKM),縱坐標表示每個log10(RPKM)值對應的基因數占比;右圖為不同樣本基因表達箱線圖,橫坐標表示不同樣本名稱,縱坐標表示樣本中每個基因log10(RPKM)分布情況。



4、差異基因篩選(Dif Gene Analysis)
采用DESeq2/DESeq/EBSeq/EdgeR/Limma等算法進行差異篩選,得到滿足差異倍數(Fold Change)以及FDR閾值的差異基因,并基于差異篩選結果以及樣本的FPKM或RPKM,進行火山圖分析(Volcano Plot)以及聚類圖分析(Heatmap)。

差異基因的火山圖和聚類圖

 liu et al., Nature, 2016

 注:左圖為差異基因的火山圖,紅色表示顯著差異基因,藍色表示非顯著差異基因;右圖為基因表達聚類圖,橫坐標為樣品分組,縱坐標為基因,紅色表示高表達,綠色表示低表達。



5、功能分析(GO Analysis)
為了明確差異基因的相關功能,我們往往需要對差異基因進行GO富集分析。NovelBio團隊在數據庫上投入了大量時間和人力,采用NCBI/UNIPROT/SWISSPROT/AMIGO等GO數據庫,對于差異基因進行功能分析,從而得到差異基因所顯著性富集的功能條目(GO Term)。

基因功能分析 

He et al., Cancer Sci, 2017 

注:該圖從生物學進程(Biological Process, BP)、分子功能(Molecular Function, MF)和細胞組分(Cellular Component, CC)3個層面展示了差異基因顯著富集的前15個功能條目。橫坐標為-Log2(P-value)/-Log10(P-value),縱坐標為Go-Term條目名稱。



6、信號通路分析(Pathway Analysis)
通過對差異基因進行Pathway富集分析,尋找不同樣品間差異基因相關的信號通路,有利于研究者進行深入的機制研究。NovelBio團隊整合了一系列生物學領域內公認的通用數據庫(KEGG、NCBI、EMBL等),深入優化所需算法,對差異基因進行信號通路分析,從而得到差異基因所顯著性富集的信號通路條目。

Pathway富集性分析

 He et al., Cancer Sci, 2017 

注:該圖展示了差異基因富集的25條Pathway條目。橫坐標為Pathway條目名稱,縱坐標為富集度(Enrichment),紅色表示顯著性條目,藍色表示非顯著性條目。



7、GO-Tree分析
采用GO數據庫中GO-term的上下級層級從屬關系,進行GO-Tree繪制,得到顯著性差異功能的功能簇以及層級從屬關系。

GO Tree Miao et al., Mol Cell Endocrinol, 2015

注:該圖展示了差異基因顯著富集的GO Terms內在從屬關系。紅色代表上調基因顯著富集的功能條目;綠色代表下調基因顯著富集的功能條目,黃色代表上調和下調基因都顯著富集的功能條目。



8、Path-Act-Network分析
采用KEGG數據庫記載的信號通路上下游調控關系,進行Path-Act-Network繪制,得到宏觀上的顯著性信號通路的上下游調控關系。

Path-Act-Network Miao et al., Mol Cell Endocrinol, 2015 

注:該圖展示了差異基因顯著富集pathway之間的上下游調控關系。紅色表示上調基因顯著富集的pathway;綠色表示下調基因顯著富集的pathway。



高級數據分析
1、共表達網絡分析(Co-Exp-Network Analysis)
對已知注釋信息進行深入的分析挖掘之后,研究者往往希望能夠找到更多的創新點。NovelBio團隊基于GO Analysis和Pathway Analysis得到的顯著性條目,以及研究者感興趣條目,以這些條目中基因的表達值為研究目標,進行共表達網絡和K-Core分析,從而得到基因間的相關性和基因的核心度,再以Co-Expression.txt和K-Core為研究對象,采用Cytoscape進行圖形化展示,得到Co-Expression-Network。

共表達網絡

 Miao X et al., Scientific reports, 2016 

注:相同顏色的圓點表示具有相似共表達能力的基因,圓點的大小表示該基因的K-core程度。



2、基因間相互作用關系網絡(Gene-Act-Network Analysis)
研究中,常常會發現差異基因過多,并且所屬信號通路也很復雜,難以將相關基因聯系起來并找到“核心”基因。NovelBio團隊基于GO Analysis和Pathway Analysis得到的顯著性條目,以研究者感興趣的相關表型基因為研究對象,采用KEGG數據庫基因間關系注釋,幫助研究者繪制Gene-Act-Network,快速定位“核心”基因。

基因互作網絡

Sun L et al,Sci Rep. 2016

注:紅色圓點表示上調mRNAs,綠色圓點表示下調mRNAs。



3、韋恩分析
韋恩圖的典型之處就在于它用一些重疊的部分來展示集合之間可能存在的關系。以各分組間的基因為研究對象,采用韋恩作圖分析的方法,可找出各分組間共有或者特有的差異表達基因并進行深入分析。

維恩分析

 Chen et al., BMC Genomics, 2014

 注:該圖表示上調基因(左)和下調基因(下)的韋恩分析圖,數字分別代表處于不同交集內的基因個數。



4、趨勢分析
在趨勢型結果中,研究者常常希望對差異基因隨著時間/邏輯趨勢的不同進行分析,而兩兩之間的比較顯然不足以滿足這樣的要求。NovelBio團隊為研究者提供了定制化的趨勢分析流程思路,以各差異分組間的韋恩基因的FPKM值為研究對象,采用STEM算法,進行趨勢分析,得到按照樣本邏輯順序所在趨勢。

趨勢分析

Chen et al., BMC Genomics, 2014

注:研究者基于趨勢分析的眾多結果,歸納、整合,最終鎖定了幾類變化趨勢類型,進而更有針對性的開展后續工作。該研究中最終歸納出了6種顯著性趨勢,研究者選擇了基因個數最多的兩種趨勢,對這些基因進行GO等深入分析。



5、加權基因共表達網絡分析(WGCNA)分析
WGCNA分析是用來描述不同樣品之間基因關聯模式的系統生物學方法?;诩訖嗟谋磉_相關性,進行層級聚類分析,并根據設定標準切分聚類結果,獲得不同的基因模塊,采用聚類樹的分枝和不同顏色來鑒定高度協同變化的基因集。如果有表型信息,還可以計算基因模塊與表型相關性,鑒定性狀相關的模塊,并根據基因集的內連性和基因集與表型之間的關聯鑒定候補生物標記基因或治療靶點。

WGCNA分析 Wan et al., Exp Eye Res. 2018 

注:左圖表示基因聚類和模塊鑒定的對應關系,高度共表達的基因群在聚類中處于相似分枝中;右圖表示模塊和表型相關性熱圖結果,方框內上面的數字是模塊ME和表型數據相關性,下面括號內的數字為相關性的P值。



文獻示例

[1] Alteration of tumor suppressor BMP5 in sporadic colorectal cancer: a genomic and transcriptomic profiling based study. Molecular Cancer. 2018 Dec; IF=7.776


[2] Gefitinib for Epidermal Growth Factor Receptor Activated Osteoarthritis Subpopulation Treatment. EBioMedicine. 2018 Jun ;IF=6.183


[3] The GARP Complex Is Involved in Intracellular Cholesterol Transport via Targeting NPC2 to Lysosomes. Cell Rep. 2017 Jun; IF=8.032


[4] Autism-like behaviours and germline transmission in transgenic monkeys overexpressing MeCP2. Nature. 2016 Feb; IF=41.577


[5] Hu, Y. et al. Interactions of OsMADS1 with floral homeotic genes in rice flower development. Mol. Plant 2015 Sep; IF=8.827


[6] Wang F, et al. Alternative splicing of the androgen receptor in polycystic ovary syndrome. Proc Natl Acad Sci U S A. 2015 Apr 14;112(15):4743-8. (IF=9.681)



色视频在线观看无码