1. 轉錄組數據分析RNA-seq
轉錄組學(transcriptomics)的研究對象是全基因組尺度下所有轉錄本(transcript),即轉錄組(transcriptome)
將熒游標記的cDNA製成微陣列探針來測定樣本中特定轉錄本含量。又稱為 基因晶元(Gene Chip)、微陣列(Microarry)。
獲取表達量的步驟:
提取RNA -> 反轉錄 (->擴增)->標記->雜交->掃描->獲得原始數據
局限性:
• 只能檢測已知或;確定性的序列
• 無法檢測新發現的,未放置到晶元上的基因
• 有部分探針的信號可能會收到非特異性雜交或個體序列差異的影響
基於高通量二代測序技術的轉錄組學研究方法。
特點:
高通量、低成本;不依賴已知轉錄本探針,可以測全轉錄組;對於低表達豐度的轉錄本靈敏
度高;以reads數量腐酸表達,比晶元的熒光信號更為精確。
應用和最新進展
依據文庫要求檢查完整性分值,如果不合格將不適合建庫測序。一些特殊文庫對RNA提取要求很高,如全長轉錄組文庫,需要特殊提取流
程保證RNA 完整性。
需要的數據:參考基因組數據fasta、GFF注釋信息、雙端測序的fastq文件
我這里用的是普通栽培稻( Oryza sativa L.)的參考基因組和、GFF文件和SRR17439319數據。
參考步驟: https://blog.csdn.net/sunchengquan/article/details/79781366
注意:配置時,需要在bin目錄下執行 ./vdb-config --interactive ,然後彈出一大堆亂七八糟的之後,按X退出即可。再執行./fastq-mp,若沒有報錯,而是幫助信息的話即可以使用。
測序數據分析前需要經過數據預處理,並檢查數據GC含量、序列重復成俗、是否存在接頭等。
在質控後,再質檢一次,對比看看有什麼不同。
將 reads 匹配到參考基因組或轉錄組的相應位置上
• 非剪接比對:轉錄組
Bowtie、BWA
• 剪接比對:參考基因組
STAR、HISAT、Topha
對鑒定SNP做了優化: GSNAP、MapSplice等
① 建立基因組索引
②利用注釋文件比對
沒有注釋文件的比對方法
③ SAM 文件處理
使用 samtools 對 SAM 文件排序並轉化為 BAM 文件。samtools是一個用於操作sam和bam文件的工具合集,包含有許多命令。
④比對結果可視化
比對結果使用 IGV 、Genome Maps 和Sacant 等可視化查看。
例如:IGV 通過讀入基因組和注釋信息以及BAM 文件展示比對結果。
需要額外添加 BMA 的索引: samtools index test_sorted.bam test_sorted.
⑤比對結果評估
比對結果評估工具:RSeQC、Qualimap
計算FPKM
-p 線程數
-G 參考基因組注釋
-e 只估計已給參考基因組注釋的基因豐度
-A 基因豐度估計輸出文件
-o 輸出文件