RNA-Seq Avançado

Introdução

RNA-Seq (RNA Sequencing) é uma técnica baseada em NGS utilizada para analisar o transcriptoma completo de um organismo.

O transcriptoma representa todas as moléculas de RNA expressas em uma célula ou tecido em um determinado momento.

RNA-Seq permite investigar expressão gênica, isoformas, eventos de splicing alternativo e regulação gênica.

Conceitos Fundamentais

  • Transcriptoma — conjunto de RNAs expressos em uma célula
  • Gene expression — nível de atividade de um gene
  • Isoformas — diferentes variantes de RNA produzidas a partir do mesmo gene
  • Splicing alternativo — combinação variável de éxons
  • Read counts — número de reads alinhadas a um gene

Workflow Experimental


Extração de RNA
 ↓
Purificação
 ↓
Conversão para cDNA
 ↓
Preparação de biblioteca
 ↓
Sequenciamento
 ↓
FASTQ

Pipeline Bioinformático


FASTQ
 ↓
Controle de Qualidade
 ↓
Trimming
 ↓
Alinhamento ao genoma
 ↓
Quantificação de expressão
 ↓
Normalização
 ↓
Análise diferencial
 ↓
Interpretação biológica

Formatos de Arquivos

Formato Descrição
FASTQ Reads brutas com qualidade
BAM Reads alinhadas
GTF/GFF Anotação de genes
Count Matrix Matriz de expressão gênica

Controle de Qualidade

Ferramentas comuns:
  • FastQC
  • MultiQC
  • Trimmomatic
  • Cutadapt

Alinhamento de Reads

Ferramentas especializadas para RNA-Seq:
  • STAR
  • HISAT2
  • TopHat2

Esses alinhadores são capazes de lidar com junções exon-exon resultantes de splicing.

Quantificação de Expressão

Métodos de quantificação:
  • HTSeq
  • FeatureCounts
  • Salmon
  • Kallisto
Métricas comuns:
  • RPKM
  • FPKM
  • TPM

Normalização

A normalização corrige diferenças de profundidade de sequenciamento entre amostras.

Métodos:
  • TMM (Trimmed Mean of M values)
  • DESeq normalization
  • Quantile normalization

Análise de Expressão Diferencial

Identifica genes cuja expressão difere entre condições experimentais.

Ferramentas principais:
  • DESeq2
  • edgeR
  • limma-voom

Splicing Alternativo

Ferramentas para análise:
  • rMATS
  • DEXSeq
  • SUPPA
Essas ferramentas detectam eventos como:
  • exon skipping
  • intron retention
  • alternative splice sites

Análise Funcional

Após identificar genes diferencialmente expressos, análises funcionais são realizadas. Ferramentas:
  • Gene Ontology enrichment
  • KEGG pathway analysis
  • GSEA (Gene Set Enrichment Analysis)

Visualização de Dados

Gráficos comuns:
  • Heatmap
  • PCA plot
  • Volcano plot
  • MA plot
Ferramentas:
  • R / Bioconductor
  • IGV
  • UCSC Genome Browser

Ferramentas Bioinformáticas

Categoria Ferramenta
QC FastQC
Alignment STAR
Quantificação HTSeq
Differential Expression DESeq2
Splicing rMATS

Aplicações Científicas

  • Estudos de expressão gênica
  • Pesquisa em câncer
  • Biologia do desenvolvimento
  • Resposta a tratamentos
  • Identificação de biomarcadores

Recursos e Bases de Dados

  • GEO Database — https://www.ncbi.nlm.nih.gov/geo
  • ENCODE Project — https://www.encodeproject.org
  • Bioconductor — https://bioconductor.org
  • KEGG Pathways — https://www.kegg.jp