RNA-Seq Avançado
Introdução
RNA-Seq (RNA Sequencing) é uma técnica baseada em NGS utilizada para analisar o transcriptoma completo de um organismo.
O transcriptoma representa todas as moléculas de RNA expressas em uma célula ou tecido em um determinado momento.
RNA-Seq permite investigar expressão gênica, isoformas, eventos de splicing alternativo e regulação gênica.
Conceitos Fundamentais
- Transcriptoma — conjunto de RNAs expressos em uma célula
- Gene expression — nível de atividade de um gene
- Isoformas — diferentes variantes de RNA produzidas a partir do mesmo gene
- Splicing alternativo — combinação variável de éxons
- Read counts — número de reads alinhadas a um gene
Workflow Experimental
Extração de RNA ↓ Purificação ↓ Conversão para cDNA ↓ Preparação de biblioteca ↓ Sequenciamento ↓ FASTQ
Pipeline Bioinformático
FASTQ ↓ Controle de Qualidade ↓ Trimming ↓ Alinhamento ao genoma ↓ Quantificação de expressão ↓ Normalização ↓ Análise diferencial ↓ Interpretação biológica
Formatos de Arquivos
| Formato | Descrição |
|---|---|
| FASTQ | Reads brutas com qualidade |
| BAM | Reads alinhadas |
| GTF/GFF | Anotação de genes |
| Count Matrix | Matriz de expressão gênica |
Controle de Qualidade
Ferramentas comuns:- FastQC
- MultiQC
- Trimmomatic
- Cutadapt
Alinhamento de Reads
Ferramentas especializadas para RNA-Seq:- STAR
- HISAT2
- TopHat2
Esses alinhadores são capazes de lidar com junções exon-exon resultantes de splicing.
Quantificação de Expressão
Métodos de quantificação:- HTSeq
- FeatureCounts
- Salmon
- Kallisto
- RPKM
- FPKM
- TPM
Normalização
A normalização corrige diferenças de profundidade de sequenciamento entre amostras.
Métodos:- TMM (Trimmed Mean of M values)
- DESeq normalization
- Quantile normalization
Análise de Expressão Diferencial
Identifica genes cuja expressão difere entre condições experimentais.
Ferramentas principais:- DESeq2
- edgeR
- limma-voom
Splicing Alternativo
Ferramentas para análise:- rMATS
- DEXSeq
- SUPPA
- exon skipping
- intron retention
- alternative splice sites
Análise Funcional
Após identificar genes diferencialmente expressos, análises funcionais são realizadas. Ferramentas:- Gene Ontology enrichment
- KEGG pathway analysis
- GSEA (Gene Set Enrichment Analysis)
Visualização de Dados
Gráficos comuns:- Heatmap
- PCA plot
- Volcano plot
- MA plot
- R / Bioconductor
- IGV
- UCSC Genome Browser
Ferramentas Bioinformáticas
| Categoria | Ferramenta |
|---|---|
| QC | FastQC |
| Alignment | STAR |
| Quantificação | HTSeq |
| Differential Expression | DESeq2 |
| Splicing | rMATS |
Aplicações Científicas
- Estudos de expressão gênica
- Pesquisa em câncer
- Biologia do desenvolvimento
- Resposta a tratamentos
- Identificação de biomarcadores
Recursos e Bases de Dados
- GEO Database — https://www.ncbi.nlm.nih.gov/geo
- ENCODE Project — https://www.encodeproject.org
- Bioconductor — https://bioconductor.org
- KEGG Pathways — https://www.kegg.jp