UNIVERSITA' DEGLI STUDI DI ROMA
"LA SAPIENZA"
FACOLTA' DI SCIENZE STATISTICHE
Corso di laurea in:
SCIENZE STATISTICHE ED ECONOMICHE
PROCEDURE STATISTICHE
PER IL CONTROLLO E LA NORMALIZZAZIONE
DI MICROARRAY DI cDNA
Relatore: Candidata:
Prof. Renato Coppi Sonia Eramo
Matricola:
04031392
Correlatore:
Prof. Agostino Di Ciaccio
Anno Accademico 2003-2004
Seduta del 23 Maggio 2005
Indice
Introduzione................................................................................................. pag. 4
Cap. I L’informazione genetica e i microarray....................................... pag. 5
1. Introduzione............................................................................................. pag. 5
2. Il DNA..................................................................................................... pag. 5
3. La topoisomerasi...................................................................................... pag. 6
4. Cosa sono i microarray............................................................................ pag. 7
5. I campi di applicazione dei microarray.................................................... pag. 9
6. Il disegno sperimentale............................................................................ pag. 9
6.1. Campione di controllo..................................................................... pag. 10
6.2. Le repliche...................................................................................... pag. 10
6.3. Unità sperimentali e assegnazioni dei trattamenti.......................... pag. 11
6.4. Altre fasi dell’esperimento.............................................................. pag. 11
6.5. Regole di confronto tra campioni................................................... pag. 12
7. Esperimento di microarray....................................................................... pag. 13
7.1. Il protocollo sperimentale............................................................... pag. 13
7.2. Esempio di esperimento di microarray di cDNA............................ pag. 14
7.3. Costruzione di microarray di cDNA............................................... pag. 15
7.4. Estrazione ed etichettatura di campioni di RNA............................. pag. 16
7.5. L’ibridazione................................................................................... pag. 17
7.6. La scansione.................................................................................... pag. 18
8. L’analisi dell’immagine........................................................................... pag. 19
8.1. La localizzazione e la segmentazione............................................. pag. 19
8.2. Estrazione dell’informazione.......................................................... pag. 20
8.2.1. L’intensità dello spot, il foreground....................................... pag. 21
8.2.2. L’intensità di background...................................................... pag. 21
8.2.3. Misure del cambio di espressione.......................................... pag. 21
Cap. II I metodi di pre-processing e di normalizzazione..................... pag. 23
1. Introduzione............................................................................................. pag. 23
2. Le fonti degli errori sistematici................................................................ pag. 23
2.1. Spatial effect................................................................................... pag. 23
2.2. Ibridazione irregolare...................................................................... pag. 23
2.3. Printing tip...................................................................................... pag. 24
2.4. Effetti causati dalle lastre e dai probe............................................. pag. 24
2.5. Effetto del gruppo di stampa e del disegno dell’array.................... pag. 24
2.6. Dye effect........................................................................................ pag. 25
2.7. Malfunzionamenti dello scanner..................................................... pag. 25
2.8. Effetto sperimentatore..................................................................... pag. 25
3. MA plot.................................................................................................... pag. 25
4. I metodi di pre-processing....................................................................... pag. 26
4.1. Il valori mancanti............................................................................ pag. 26
4.2. Sottrazione di background.............................................................. pag. 27
4.3. Alcuni tipi di trasformazioni........................................................... pag. 28
4.4. Le repliche...................................................................................... pag. 29
4.5. Media di repliche............................................................................ pag. 29
4.6. Controllo della qualità delle repliche.............................................. pag. 30
4.6.1. Repliche dei chip................................................................. pag. 30
4.6.2. Repliche di spot................................................................... pag. 30
4.6.3. Repliche “cattive”............................................................... pag. 31
4.7. Outlier............................................................................................. pag. 31
4.8. Filtro dei dati non attendibili........................................................... pag. 32
4.9. Filtro dei dati non interessanti......................................................... pag. 33
4.10. Statistiche semplici......................................................................... pag. 33
4.10.1. Media e mediana................................................................. pag. 33
4.10.2. Scarto quadratico medio..................................................... pag. 33
4.10.3. Varianza.............................................................................. pag. 33
4.10.4. Asimmetria e normalità....................................................... pag. 34
4.11. Test Statistici................................................................................... pag. 35
4.11.1. T-test................................................................................... pag. 35
4.11.2. Test dei segni...................................................................... pag. 36
4.11.3. Analisi della varianza.......................................................... pag. 37
4.12. Linearità.......................................................................................... pag. 38
5. I metodi di normalizzazione..................................................................... pag. 39
5.1. Geni di controllo............................................................................. pag. 40
5.2. Normalizzazione globale e locale................................................... pag. 41
5.3. Scelta del metodo............................................................................ pag. 41
5.4. Within-slide location normalization............................................... pag. 41
5.4.1. Metodi di normalizzazione globale........................................ pag. 41
5.4.2. Metodi di normalizzazione locale.......................................... pag. 42
5.5. Within-slide scale normalization.................................................... pag. 44
5.6. Multiple-slide normalization........................................................... pag. 44
5.7. Paired-slide normalization.............................................................. pag. 46
6. Alcune considerazioni.............................................................................. pag. 47
Cap. III I dati e la strategia di analisi...................................................... pag. 49
1. Introduzione............................................................................................. pag. 49
2. La strategia di analisi............................................................................... pag. 49
3. Descrizione dei dati.................................................................................. pag. 49
4. Assunzione base....................................................................................... pag. 53
5. Dati validi................................................................................................. pag. 53
6. Variabili utilizzate nell’analisi................................................................. pag. 55
Cap. IV La qualità dei dati....................................................................... pag. 56
1. Introduzione............................................................................................. pag. 56
2. Foreground vs background...................................................................... pag. 56
3. Rapporto del segnale di background........................................................ pag. 57
4. Sottrazione di background....................................................................... pag. 58
5. Valori estremi........................................................................................... pag. 60
6. Conclusioni.............................................................................................. pag. 61
Cap. V Identificazione dell’errore sistematico....................................... pag. 63
1. Introduzione............................................................................................. pag. 63
2. Struttura del microarray........................................................................... pag. 63
3. Le trasformazioni..................................................................................... pag. 63
4. Scelta delle variabili................................................................................. pag. 63
5. Analisi generale....................................................................................... pag. 65
5.1. Dati non trasformati........................................................................ pag. 65
5.2. Trasformate logaritmiche................................................................ pag. 68
5.3. Log Ratio........................................................................................ pag. 71
6. Analisi per blocchi................................................................................... pag. 72
6.1. Dati non trasformati........................................................................ pag. 72
6.2. Trasformate logaritmiche................................................................ pag. 74
6.3. Log Ratio........................................................................................ pag. 75
6.3.1. Test dei dati appaiati.............................................................. pag. 75
6.3.2. Analisi della varianza............................................................. pag. 76
6.3.3. MA plot.................................................................................. pag. 77
7. Conclusioni.............................................................................................. pag. 79
Cap. VI La normalizzazione..................................................................... pag. 80
1. Introduzione............................................................................................. pag. 80
2. Metodi...................................................................................................... pag. 80
3. Normalizzazione globale: median centering............................................ pag. 81
4. Normalizzazione locale............................................................................ pag. 81
4.1 Subarraywise median centering......................................................... pag. 81
4.2 Intensity dependent normalization..................................................... pag. 81
4.3 Within-print-tip group-normalization: location................................. pag. 82
4.4 Within-print-tip group-normalization: scale……………………….. pag. 83
5. Confronto fra i metodi di normalizzazione.............................................. pag. 83
6. Conclusioni.............................................................................................. pag. 89
Conclusioni................................................................................................... pag. 90
Riferimenti bibliografici ............................................................................. pag. 95