TECNOLOGIA

I recenti progressi nelle tecnologie di sequenziamento massivo in parallelo (MPS) di nuova generazione (Roche 454 GS FLX, Illumina HiSeq e Life Technologies IonTorrent) hanno completamente cambiato il modo in cui è possibile fare analisi di trascrittomica quantitativa. Queste nuove tecnologie hanno ridotto significativamente sia i costi che i tempi richiesti rendendo il sequenziamento un’opzione accessibile ed applicabile a svariati contesti sperimentali [1-2].

Applicato inizialmente per lo più ai genomi, l’MPS è stato recentemente utilizzato per l’analisi diretta del contenuto di RNA delle cellule, senza il bisogno di effettuare i tradizionali step di clonaggio molecolare necessari per il sequenziamento delle librerie di EST (expressed sequence tags).

Questo approccio, chiamato “RNA-seq”, può generare informazioni sui livelli di espressione dei trascritti analizzati equivalenti a quelle prodotte mediante analisi di microarrays con il vantaggio ulteriore che l’intero trascrittoma può essere analizzato anche senza informazioni a priori sulle regioni trascritte [1-2].

Tutti gli esperimenti di RNA-seq seguono un protocollo simile: l’RNA totale viene estratto dal campione di interesse e, a seconda del tipo di RNA che si vuole analizzare, da esso vengono purificati gli mRNA, i microRNA, i long non-codingRNA, etc., e con questi viene costruita una libreria di sequenziamento. La preparazione della libreria di solito include step quali la retrotrascrizione in cDNA dell’RNA, la frammentazione dei cDNA e l’amplificazione per PCR. Inoltre è possibile effettuare dei passaggi che consentono di conservare l’informazione del filamento di DNA trascritto. Il successivo sequenziamento può produrre una unica sequenza (read) per ciascun frammento di cDNA sequenziato (sequenziamento in single-end) o due reads per ciascun frammento (sequenziamento in paired-end). Le reads prodotte (di solito decine di milioni per esperimento) possono essere utilizzate per quantificare i livelli di espressione dei geni annotati in un genoma di riferimento o, in alternativa, possono essere assemblate “de novo” in un trascrittoma di riferimento utilizzando apposite pipeline bioinformatiche (Figura 1). Il grande vantaggio di questa tecnica risiede quindi nella possibilità di effettuare sia analisi quantitative dei livelli di espressione dei trascritti sia di definire la struttura stessa dei trascritti individuando anche isoforme prodotte ad esempio mediante splicing alternativo. I risultati delle analisi di RNA-seq hanno cambiato radicalmente la nostra visione dei trascrittomi eucariotici mostrando che il trascrittoma è molto più complesso di quanto immaginato in precedenza [3].

L’RNA-seq è stato anche applicato recentemente ad analisi di trascrittomica comparata di popolazioni mostrando il suo grande potenziale per applicazioni senza genoma di riferimento in organismi non modello quali identificazione di SNP, analisi di geni coinvolti in processi di speciazione ed analisi filogenomica [4-5]. Inoltre, approcci di trascrittomica basati sull’RNA-seq possono essere molto utili anche per l’identificazione diretta di virus in animali vettori di malattie catturati in natura. Recenti studi hanno mostrato le potenzialità e la fattibilità del’MPS per l’identificazione di nuovi agenti eziologici [6-7-8].

Nel nostro progetto di ricerca utilizzeremo la tecnologia di sequenziamento Illumina e delle pipeline di analisi basate sul software Trinity (Figura 2) [9] per l’analisi di ceppi di laboratorio e di individui di popolazioni naturali per chiarire i meccanismi molecolari della determinazione del sesso in Ae. albopictus e P. perniciosus e per comprendere la struttura genetica delle popolazioni presenti nella regione Campania. Inoltre, questo approccio potrà consentire di ottenere una mappa di distribuzione di virus e parassiti presenti nelle suddette popolazioni.

FIGURA 1 | RNA-seq reads usage FIGURA 2 | Trinity assembler analysis pipeline