1 / 29

Summaries of Affymetrix GeneChip probe level data 2002

Summaries of Affymetrix GeneChip probe level data 2002. Summaries of Affymetrix GeneChip probe level data 2002. Affymetrix GeneChip. Affymetrix GeneChip. PM = Perfect Match. MM = MisMatch. PROBE SET PARA DETECTAR EXPRESION DE GEN (mRNA) X ( 11-20 PROBES). i = indicador de array (1,…., 9).

jory
Download Presentation

Summaries of Affymetrix GeneChip probe level data 2002

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Summaries of Affymetrix GeneChip probe level data2002 Summaries of Affymetrix GeneChip probe level data2002

  2. Affymetrix GeneChip

  3. Affymetrix GeneChip PM = Perfect Match MM = MisMatch PROBE SET PARA DETECTAR EXPRESION DE GEN (mRNA) X ( 11-20 PROBES) i = indicador de array (1,…., 9) j = indicador de probe pair (1,…., 11-20)

  4. 4 MODELOS DE MEDICIÓN DE LA EXPRESIÓN GÉNICA EN GeneChip VERSIÓN VIEJA DEL SOFTWARE DE ANÁLISIS DE AFFYMETRIX MAS 5.0 (ÚLTIMA VERSIÓN DEL SOFTWARE DE ANÁLISIS DE AFFYMETRIX) dChip RMA

  5. 4 MODELOS DE MEDICIÓN DE LA EXPRESIÓN GÉNICA EN GeneChip VERSIÓN VIEJA DEL SOFTWARE DE ANÁLISIS DE AFFYMETRIX MAS 5.0 (ÚLTIMA VERSIÓN DEL SOFTWARE DE ANÁLISIS DE AFFYMETRIX) MODELOS COMPARADOS dChip RMA

  6. VERSIÓN VIEJA DEL SOFTWARE DE ANÁLISIS DE AFFYMETRIX PROMEDIO DE LAS DIFERENCIAS ENTRE PARES DE PROBES PMij– MMij , j =1,…..,J para cada arreglo i Se utiliza un promedio robusto para proteger contra outliers MODELO ESTADÍSTICO Diferencia de Promedios (AD): PMij– MMij = θi + εij, j =1,…..,J θi = cantidad de expresión en el arreglo i εij = error PERO……………… AD es apropiada cuando la varianza del término de error εij es igual para j =1,…J εij≠ para j =1,…J en datos a nivel probe de GeneChip mayor intensidad media de la probe mayor varianza!!!!

  7. VERSIÓN NUEVA DEL SOFTWARE DE ANÁLISIS DE AFFYMETRIX (MAS 5.0) TRANSFORMACIÓN LOGARÍTMICA : REDUCE LA DEPENDENCIA EN LA VARIANZA DE LA MEDIA SEÑAL: anti-log del promedio robusto (Tukey biweight) de los valores: log ( PMij– Ctij ), j =1,…..,J para cada arreglo i CT = MM , cuando MM < PM CT = CT < PM cuando MM ≥ PM (evita log de números< 0) MODELO ESTADÍSTICO log( PMij– CTij )= log( θi ) + εij, j =1,…..,J PERO……………… varianza de una probe particular entre arreglos <<< varianza entre probes del probe set Efecto fuerte de afinidad de probe!!!!!

  8. dChip SOFTWARE PACKAGE TIENE EN CUENTA EL EFECTO AFINIDAD DE PROBE ENTRE ARREGLOS CUANDO ESTAN DISPONIBLES MUCHOS ARREGLOS POR EXPERIMENTO MODELO MULTIPLICATIVO PMij– MMij = θiΦj + εij, i=1,…..,I, j =1,…..,J Φj = efecto de afinidad de probe

  9. MEDICIÓN DE EXPRESIÓN RMA ( log scale Robust Multi-array Analysis) MODELO ADITIVO DE ESCALA LOGARÍTMICA T(PMij) = ei + aj + εij, i=1,…..,I, j =1,…..,J T = transformación de las intensidades PM por background (corrección, normalización, log.) ei= escalalog2 del valor de expresión en arreglos i=1,….,I aj= escala log efecto afinidad para probes j=1,….,J eise estima por un método robusto (median polish) Normalización y corrección de background según: Irizarry, R. et. al.(2003) Exploration, normalization, and summaries of high density oligonucleotide array probe level data, Biostatistics.

  10. PROBLEMA DE MM SUBSTRACTION (background) Substracción de MM no siempre es apropiado: Irizarry, R. et. al.(2003) Exploration, normalization, and summaries of high density oligonucleotide array probe level data, Biostatistics. Naef, F. et. al. (2002) Empirical characterization oof the expression ratio noise structure in high-density oligonucleotide arrays, Genome Biology, 3, RESEARCH0018. Hay información del binding no específico en la señal MM Pero.…. empíricamente la substración matemática no se traduce en la substracción biológica del background Hasta que no haya soluciones mejores……..MEJOR IGNORAR MM !!

  11. EXPERIMENTOS Comparación entre MAS 5.0, dChip y RMA datos de experimentos de DILUCIÓN y SPIKE-IN previamente realizados CRITERIO DE COMPARACION: i) Precisión de la medida de expresión (desviación standard entre chips replica) ii) Consistencia de fold change (entre diferentes concentraciones de cRNA hibridizadas al chip) iii) Especificidad y sensibilidad de la habilidad de la medición en la detección de expresión diferencial (curvas ROC, Receiver Operating Characteristic)

  12. EXPERIMENTOS DE DILUCIÓN* cRNA de higado humano cRNA de línea celular proveniente del CNS Hibridizaciones por separado de X 6 concentraciones diferentes (1.25, 2.5, 5.0, 7.5, 10.0 y 20.0 μgrs. de cRNA / vol.) X 5 réplicas por clase de cRNA n = 60 total * http://qolotus02.genelogic.com/datasets.nsf/

  13. EXPERIMENTOS DE SPIKE-IN Affymetrix http://www.affymetrix.com/analysis/download_center2.affx DOS familias de datos GeneLogic http://qolotus02.genelogic.com/datasets.nsf/

  14. EXPERIMENTOS DE SPIKE-IN Affymetrix 14 spiking cRNAs control humanos agregados a concentraciones conocidas Cuadrado latino de 14 grupos de arreglos x 14 grupos de concentraciones que rotan (0, 0.25, 0.5, 1, 2, 4, 8, 16, 32, 64, 128, 256, 512 y 1024 pM), 3 replicas por condición, n=42 total

  15. EXPERIMENTOS DE SPIKE-IN GeneLogic 11 spiking cRNAs control agregados a un background común de cRNA de tejido humano AML BioB-5, BioB-M, BioB-3, BioC-5, BioC-3 y BioDn-5 (E. coli) CreX-5, CreX-3 (fago P1) DapX-5, DapX-M, y DapX-3 (B. subtilis) cuadrado latino cíclico de 12 x 12 concentraciones (0.5, 1, 1.5, 2, 3, 5, 12.5, 25, 37.5, 50, 75 y 100 pM), 3 réplicas por condición, n=36 total

  16. i) Precisión de la medida de expresión (desviación standard entre chips replica) MAS 5.0 dChip RMA SD no varía con el nivel de expresión

  17. ii) Consistencia de fold change (entre diferentes concentraciones de cRNA hibridizadas al chip) Discrepancias de al menos 2 folds: Log cambio de fold para 20 μg MAS 5.0 : 1223 genes dChip: 302 genes RMA: 22 genes Log cambio de fold para 1.25 μg dChip RMA MAS 5.0 R2=0.85 R2=0.95 R2=0.97

  18. iii) Especificidad y sensibilidad de la habilidad de la medición en la detección de expresión diferencial (curvas ROC, Receiver Operating Characteristic) 10 pares de arreglos elegidos random de las familias de datos de Affymetrix y GeneLogic Estimaron fold change con MAS 5.0, dChip y RMA Amplio rango de Cut-offs FALSOS POSITIVOS y VERDADEROS POSITIVOS genes NO spike in que presentan fold change mayor que el cut-off genes spike in que presentan fold change mayor que el cut-off SENSIBILIDAD 1- ESPECIFICIDAD

  19. CURVAS ROC, Receiver Operating Characteristic) > AREA BAJO LA CURVA => > SENSIBILIDAD + > ESPECIFICIDAD (0,1) función ideal sensibilidad 1-especificidad (1,0) función siempre mal

  20. CURVAS ROC, Receiver Operating Characteristic) 1 2 3 sensibilidad 4 1-especificidad

  21. CURVAS ROC, Receiver Operating Characteristic) 1 2 3 sensibilidad 4 1-especificidad

  22. 10 pares de arrays , fold change 2 – 1024 MAS 5.0 dChip RMA

  23. 10 pares de arrays , fold change 2

  24. Affymetrix ofrece una alternativa para calcular cambios en la expresión por fold change Valor P de estadística no paramétrica Crean un valor estadístico para RMA y dChip basado en estimados del error standard del probe level data COMPARAN EL P DE Affymetrix con los valores de RMA y dChip en curvas ROC

  25. 2 arrays , fold change 2 – 1024

  26. 2 sets de 12 arrays iguales , fold change promedio

  27. iii) Gráficos M vs. A ( sobre experimentos spike-in Affymetrix ) Mgen x= log2 ( expresión arreglo 1 / expresión arreglo 2 ) Agen x=( log2expresión arreglo 1 + log2 expresión arreglo 2 ) / 2 puntos rojos: genes no spike-in con fold change > 2 puntos negros: genes no spike-in con fold change ≤2 números coloreados: genes spike-in (log2 fold change) M A Menor varianza en genes con menor expresión en RMA RMA dChip MAS 5.0

  28. iii) Color Box Plots – distribución de fold change de genes no spike-in 0.99 muy cerca de fold change 0 Observed log fold change mediana dChip MAS 5.0 RMA

  29. Conclusiones - Discusión RMA mide mejor que dChip y MAS 5.0 respectivamente. RMA tiene mejor precisión particularmente para valores de expresión bajos. RMA estima mejor fold changes. RMA tiene mejor sensibilidad y especificidad para detectar diferencias de expresión por fold change.

More Related