400 likes | 548 Views
<>. International Consortium Launches Genetic Variation Mapping Project HapMap Will Help Identify Genetic Contributions to Common Diseases October 2002
E N D
<> International Consortium Launches Genetic Variation Mapping Project HapMap Will Help Identify Genetic Contributions to Common Diseases October 2002 WASHINGTON- An international research consortium today launched an approximately $100 million public-private effort to create the next generation map of the human genome. Called the International HapMapProject, this new venture is aimed at speeding the discovery of genes related to common illnesses such as asthma, cancer, diabetes and heart disease.
Objectius del projecte HapMap • Desenvolupar una eïna útil per a l’estudi de la relació entre la variabilitat humana i les malalties • Caracteritzar una àmplia col.lecció de SNPs distribuïts en tot el genoma • Identificar variants funcionals • Desenvolupar nous mètodes per identificar variants rares en gens d’interés • Determinar l’estructura d’haplotips • Identificar una col.lecció de tagSNPs • Desenvolupar estratègies de genotipat d’alt rendiment • Fer-ho en quatre poblacions humanes de referència
Les quatre poblacions • Yoruba (Ibadan, Nigeria) • 30 parent-child trios (n=90, 180 chromosomes) • 60 unrelated individuals (parents) (n=60, 120 chromosomes) • Han Chinese (Beijing, China) • 45 unrelated individuals (n=45, 90 chromosomes) • Japanese (Tokyo, Japan) • 45 unrelated individuals (n=45, 90 chromosomes) • CEPH (Utah residents with Northern & Western European ancestry) • 30 parent-child trios (n=90, 180 chromosomes) • 60 unrelated individuals (parents) (n=60, 120 chromosomes)
Criteris d’inclussió • Yoruba • 4/4 Yoruba grandparents • Han Chinese • At least 3/4 Han Chinese grandparents • Japanese • “Japanese ancestry” • CEPH • Collected in 1980; inclusion criteria not specified
Perquè aquestes poblacions? • Qualsevol població humana conté el 90% de la variabilitat genètica que existeix en tot el mon. • Els haplotips més freqüents en una població estaran presents en totes les poblacions humanes • El projecte HapMap podria haver incorporat qualsevol població humana.
Tot i així………… • La freqüència d’un determinat haplotip pot variar entre poblacions. • El patró i la grandària dels blocs poden variar entre poblacions • Aquestes diferencies són de gran importància per a la caracterització dels gens implicats en malalties humanes.
Per això………… • L’estudi de mostres procedents de més d’una població humana amb diferents històries evolutives farà que les dades obtingudes en el projecte HapMap puguin aplicar-se de forma més generalitzada.
El projecte a desembre 2004 SNPs Genotipats • CEU (CEPH) • 956,730 • Han Chinese • 412,669 • Japanese • 412,608 • Yoruba • 432,523 • Totals • 1.353.473 HapMap data release #14, December 2004, on NCBI B34 assembly, dbSNP b121 --
Accés a les dades de l’International HapMap project http://www.hapmap.org/index.html.en
Bulk Genotype Data Podem guardar l’arxiu en format Text i capturar-lo en una fulla excel per al seu estudi
Bulk LD Data Podem guardar l’arxiu en format Text i capturar-lo en una fulla excel per al seu estudi
Bulk Frequency Data Podem guardar l’arxiu en format Text i capturar-lo en una fulla excel per al seu estudi
12 11 1420 1420 2 10 9 1 Bulk Sample Data Podem guardar l’arxiu en format Text i capturar-lo en una fulla excel per al seu estudi
Regió mostrada Podem cercar en el cromosoma 10 un determinat ítem, utilitzant paraules clau com: Chr10:660,000..760,000 , SNP:rs6870660 , NM_032757 , BRCA2 , 5q31 Posem per exemple rs10008, que és un SNP localitzat en el cromosoma 10 Finestra per realitzar recerca de nous items Finestra per redefinir la grandària de la regió flanquejant Representació gràfica de la regió observada Personalització de la captura de dades “al detall” Opcions per personalitzar la representació gràfica Finestra HapMapCromosoma 10 rs10008
Finestra per rs10008 Regió observada Podem ampliar la regió observada
Regió de 20 Kb a l’entorn de rs10008 Podem obtenir informació sobre les freqüències i característiques de cada SNP
Volem més... Per obtenir dades “al detall” haurem d’anar a la finestra de “Fuente de datos”
Finestra “Fuente de Datos”Decorated FASTA File Obtenim un arxiu en format FASTA que podem guardar en text per la seva utilització posterior. La seqüència correspon a la regió indicada en la capcelera de l’arxiu.
Finestra “Fuente de Datos”HapMap LD Data Podem guardar l’arxiu en format Text i capturar-lo en una fulla excel per al seu estudi
Finestra “Fuente de Datos”SNP Frequency Data Podem guardar l’arxiu en format Text i capturar-lo en una fulla excel per al seu estudi
Finestra “Fuente de Datos”SNP Genotype Data Podem guardar l’arxiu en format Text i capturar-lo en una fulla excel per al seu estudi
Altres formes d’accedir a la informació Desplaçament pel cromosoma CCR5
Altres formes d’accedir a la informació CCR5 Introduir un mot clau a la finestra de cercar
Si el mot clau és poc específic, p ex. “interferon” obtindrem:
Categorització dels SNP Categoria 1 "verificats per genotip" • SNPs pels quals hi ha informació sobre freqüències al.lèliques i genotípiques Categoria 2 "two-hit" • SNP observats en dues mostres independents Categoria 3 “verificats per seqüència" • SNP verificats manualment sobre les dades de seqüenciació però sense genotips disponibles. Categoria 4 "bac-overlap" • SNPs caracteritzats per comparació de seqüència de clons BAC. Categoria 5 "tsc-overlap" • SNPs procedents del projecte TSC (http://snp.cshl.org) en condicions similars a la categoria anterior Altres categories • "cSNP": SNPs codificants, segons NCBI • "non-validats“