Ensamblamiento de fragmentos de adn
Download
1 / 84

ENSAMBLAMIENTO DE FRAGMENTOS DE ADN - PowerPoint PPT Presentation


  • 137 Views
  • Uploaded on

ENSAMBLAMIENTO DE FRAGMENTOS DE ADN. Matías Brunstein Macri Alejandro Pedraza Jimena Rinaldi. 2004 Introducción a la Biología Computacional Departamento de Computación-FCEN-UBA. Primera Parte. Biological Background. Genoma y Genómica.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' ENSAMBLAMIENTO DE FRAGMENTOS DE ADN' - chava


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Ensamblamiento de fragmentos de adn

ENSAMBLAMIENTO DE FRAGMENTOS DE ADN

Matías Brunstein Macri

Alejandro Pedraza

Jimena Rinaldi

2004

Introducción a la Biología Computacional

Departamento de Computación-FCEN-UBA.


Primera parte

Primera Parte

Biological Background


Genoma y Genómica

Genoma. Complemento genético entero y haploide de un organismo. Es decir toda la secuencia de ADN, codificante o no codificante y su posición en los cromosomas.

Genómica. Disciplina que se ocupa de la caracterización de los genomas. Se encuentra dividida en Genómica Estructural y la Genómica Funcional.

Objetivo de la Genómica Estructural es conocer el/los genoma/s de una especie en particular/diferentes especies.

.


Aplicaciones del estudio de los genomas
Aplicaciones delestudio de los genomas

  • Predecir genes, secuencias promotoras y reguladoras de la transcripción.

  • Comparar genomas de diferentes individuos de la misma especie para detectar variaciones o polimorfismos a nivel poblacional. Estas variaciones pueden ser sustituciones, deleciones/inserciones, o rearreglos cromosómicos (cambio de posición en el genoma).


Aplicaciones del estudio de los genomas1
Aplicaciones delestudio de los genomas

  • Comparar genomas de diferentes especies. Esto permite hacer inferencias acerca de los procesos evolutivos de remodelación de genomas.

  • Otras.


Genomas eucari ticos y procari ticos
Genomas eucarióticos y procarióticos


Genomas animales y vegetales


Sizes of eukaryotic genomes

Species

Genome size (Mb)

Fungi

Saccharomyces cerevisiae

12.1

Aspergillus nidulans

25.4

Protozoa

Tetrahymena pyriformis

190

Invertebrates

Caenorhabditis elegans

97

Drosophila melanogaster

180

490

Bombyx mori (silkworm)

Strongylocentrotus purpuratus (sea urchin)

845

Locusta migratoria (locust)

5000

Vertebrates

400

Takifugu rubripes (pufferfish)

Homo sapiens

3200

Mus musculus (mouse)

3300

Plants

Arabidopsis thaliana (vetch)

125

Oryza sativa (rice)

430

Zea mays (maize)

2500

Pisum sativum (pea)

4800

Triticum aestivum (wheat)

16000

Fritillaria assyriaca (fritillary)

120000



Secuencias repetitivas
Secuencias repetitivas

  • Distintos tipos de secuencias repetitivas se encuentran en muchos organismos y ocupan gran parte de los genomas:

    • Satélites

    • Pseudogenes

    • Transposones y retrotransposones

  • Pueden estar esparcidas por el genoma o en tandem y varían mucho en tamaño.


C mo se estudian los genomas
¿Cómo se estudian los genomas?

  • Mapeo genético

  • Mapeo físico

  • Secuenciación exhaustiva


El mapeo gen tico
El mapeo genético

El mapeo genético está basado en la utilización de técnicas genéticas para construir mapas que muestran la posición de marcadores genéticos o de marcadores moleculares. Las técnicas genéticas incluyen experimentos de recombinación y estudio de pedigrees en humanos.


El mapeo f sico
El mapeo físico

El mapeo físico utiliza técnicas de Biología Molecular para examinar directamente las moléculas de ADN para la construcción de mapas que muestran la posición de fragmentos de ADN (en general de secuencia desconocida) en el genoma.


Secuenciación automática

Fragmentos de hasta 700 pb


Bibliotecas gen micas
Bibliotecas genómicas

  • Como no es posible secuenciar un genoma en una sola reacción de secuenciación se lo divide en fragmentos, los cuales se almacenan en clones bibliotecas genómicas.

  • Una biblioteca genómica es un conjunto de clones, cada uno de los cuales contiene un fragmento de un genoma de un organismo dado.

  • Las bibliotecas genómicas se consiguen clonando los fragmentos en vectores.




Vectores de clonado
Vectores de Clonado genomas

Problema de los YACs


Vectores de clonado1
Vectores de Clonado genomas

  • Otros vectores que incluyen insertos de gran tamaño:

    • Bacteriógafos P1

    • BACs

    • PACs

    • Fósmidos


Sizes of human genomic libraries prepared in different types of cloning vector

* Calculated from the equation:where N is the number of clones required, P is the probability that any given segment of the genome is present in the library, a is the average size of the DNA fragments inserted into the vector, and b is the size of the genome.

Number of clones*

Type of vector

Insert size (kb)

P = 95%

P = 99%

l replacement

820 000

18

532 500

40

240 000

Cosmid, fosmid

370 000

P1

118 000

125

77 000

BAC, PAC

50 000

300

32 000

600

16 000

YAC

24 500

Mega-YAC

10 500

1400

6850


Ensamblado shotgun approach
Ensamblado: of cloning vectorShotgun approach

Consiste en ensamblar directamente los fragmentos de ADN secuenciados por superposición.


Haemophilus influenzae of cloning vector

1995

1830 kb, biblioteca genómica

18.638 clones,

insertos de 1,6-2 kb.


Resoluci n de gaps
Resolución de gaps of cloning vector



Ensamblado clone contig approach
Ensamblado: of cloning vectorClone Contig Approach

  • Se clonan fragmentos de hasta 1,5 Mb en YACs o BACs.

  • Se construye un contig identificando los clones que contienen fragmentos superpuestos, los cuales se secuencian por el método de shotgun.


Whole genome shotgun sequencing
Whole genome shotgun sequencing of cloning vector

  • La experiencia con el método de shotgun en genomas chicos mostró que si el largo total de la secuencia que se genera es 6,5-8 veces el largo de la secuencia total del genoma estudiado, entonces los contigs resultantes ocuparan el 99,8% de la secuencia del genoma, con unos gaps tales que se pueden resolver facilmente.

  • 70 millones de fragmentos de 500pb resolverían el genoma humano en 3 anos con 75 secuenciadores, cada uno de los cuales puede secuenciar 1000 secuencias de esas por días.


Ejemplo de genomas de los cuales se ha publicado la secuencia en versión completa o borrador

Especie

Tamaño del genoma (Mb)

Nro de genes estimados

Eukarya

Arabidopsis thaliana (plant)

125

25 500

Caenorhabditis elegans (nematode)

97

19 000

Drosophila melanogaster (fruit fly)

180

13 600

Homo sapiens (human)

3200

30 000 - 40 000

Saccharomyces cerevisiae (yeast)

12.1

5800

Eubacteria

Escherichia coli K12

4.64

4400

Mycobacterium tuberculosis H37Rv

4.41

4000

Mycoplasma genitalium

0.58

500

Pseudomonas aeruginosa PA01

6.26

5700

Streptococcus pneumoniae

2.16

2300

Vibrio cholerae El Tor N16961

4.03

4000

Yersinia pestis CO92

4.65

4100

Archeae

Archaeoglobus fulgidus

2.18

2500

Methanococcus jannaschii

1.66

1750


Complicaciones
Complicaciones secuencia en versión completa o borrador

  • Instancias reales del problema muy largas

  • Errores

    • Inserciones

    • Deleciones

    • sustituciones

  • Fragmentos quiméricos

  • Orientación desconocida

  • Regiones repetidas

  • Pérdida de cobertura (gaps)


Segunda parte

Segunda Parte secuencia en versión completa o borrador

Modelos


Qu es un modelo
¿Qué es un modelo? secuencia en versión completa o borrador

  • Es una abstracción de la realidad que nos facilita el estudio de un fenómeno o problema.

  • Un modelo no es un algoritmo

    • Como veremos más adelante, para un mismo modelo pueden plantearse varios algoritmos.


Modelos para el ensamblamiento de adn
Modelos para el ensamblamiento de ADN secuencia en versión completa o borrador

  • Plantearemos tres modelos teóricos.

    • Shortest Common Superstring

    • Reconstruction

    • Multicontig

  • Cada uno plantea distintas restricción sobre los fragmentos.

  • Se asume que las muestras están libres de contaminación.


Primer modelo shortest common superstring
Primer Modelo: secuencia en versión completa o borradorShortest Common Superstring

  • Tiene principalmente interés teórico pues no es muy útil en la realidad.

  • Plantea muchas restricciones:

    • Los fragmentos no deben tener errores

    • Deben estar orientados correctamente

    • La secuencia buscada no debe tener repeticiones


Scs definici n
SCS: Definición secuencia en versión completa o borrador

Dado un conjunto de strings F, hallar un string S de longitud mínima tal que para todo string f en F, f es substring de S.

Notar que S debe ser un superstring perfecto, por lo que no permites errores experimentales.

Se debe conocer la orientacíon de cada string f.


Scs ejemplo
SCS: Ejemplo secuencia en versión completa o borrador

F = {ACT, CTA, AGT}

S = ACTAGT


Scs repeticiones
SCS: Repeticiones secuencia en versión completa o borrador

Supongamos que secuenciamos la siguiente cadena de nucleótidos

S = ACTTGTAAGGTTGTTAAG

de la cual obtenemos los siguientes fragmentos

F = {ACTT, TTGTAA, AAGGT, TTGT, GTT, TTAG}


Scs repeticiones cont
SCS: Repeticiones (Cont.) secuencia en versión completa o borrador

Según este modelo, el resultado de hallar el SCS de F sería:


Scs resumen
SCS: Resumen secuencia en versión completa o borrador

  • No admite repeticiones

  • No admite errores experimentales

  • Se debe conocer la orientación de los fragmentos.

  • Es un problema NP-Hard.

  • No resulta práctico para aplicaciones reales debido a la gran cantidad de restricciones y limitaciones.


Qu significa np hard
¿Qué significa NP-Hard? secuencia en versión completa o borrador

  • NP-Completo se refiere a una familia de problemas de decisión para los cuales no se conoce una solución polinomial.

  • Los problemas de decisión son aquellos para los que se espera una respuesta del tipo “sí” o “no”.


Qu significa np hard1
¿Qué significa NP-Hard? secuencia en versión completa o borrador

  • En el caso del TSP, el problema sería:¿Existe un camino que pase por todas las ciudades exactamente una vez recorriendo una distancia menor a 500 Km.?

  • La respuesta esperada es simplemente “sí” o “no”.


Qu significa np hard2
¿Qué significa NP-Hard? secuencia en versión completa o borrador

  • Un problema HP-Hard es el problema de optimización asociado a un problema NP-Completo.

  • En nuestro caso:¿Cuál es el camino más corto que pasa exactamente una vez por cada ciudad?


Segundo modelo reconstruction
Segundo Modelo: secuencia en versión completa o borradorReconstruction

  • Este modelo tiene en cuenta:

    • Errores.

    • Orientación desconocida

  • Pero no modela:

    • Repeticiones

    • Falta de cubrimiento


Reconstruction definiciones
Reconstruction: Definiciones secuencia en versión completa o borrador

Para entender como este modelo considera los errores debemos contar con algunas definiciones previas.

  • Distancia de edición (o edit distance)

  • Distancia de edición de substrings (o substring edit distance)

  • Substring aproximado


Distancia de edici n
Distancia de Edición secuencia en versión completa o borrador

Dadas dos cadenas a y b, llamaremos distancia de edición, y lo notaremos d(a, b), a la cantidad de inserciones, deleciones y/o substituciones que deben realizarse sobre las cadenas para que valga a = b.

Ejemplo: d(ACTGT, AGGT) = 2

pues ACTGT = ACTGT

Inserción

Substitución


Distancia de edici n de substrings
Distancia de Edición de Substrings secuencia en versión completa o borrador

Dadas dos cadenas a y b, llamaremos distancia de edición de substrings a:

donde S(b) es el conjunto de los substrings de b.

Ejemplo: ds(ACT, GATTACA) = 1

Pues d(ACT, ACA) = 1 y ACT  S(b)


Substring aproximado
Substring Aproximado secuencia en versión completa o borrador

Sea  un número real entre 0 y 1. Un string f es un substring aproximado de S con error cuando

donde |f| es la longitud del stringf.

Por ejemplo: si  = 0.05, permitiremos que f difiera en a lo sumo un 5% con el substring màs cercano en S.


Reconstruction definici n
Reconstruction: Definición secuencia en versión completa o borrador

Dado un conjunto de strings F y una cota de error  entre 0 y 1, hallar un string S de longitud mínima tal que para todo string f en F

donde f es el string reverso y complementario a f.


Reconstruction resumen
Reconstruction: Resumen secuencia en versión completa o borrador

  • No admite repeticiones ni espacios no cubiertos

  • Admite errores experimentales

  • Modela la orientación desconocida

  • Es un problema NP-Hard.

  • SCS es un caso particular de este modelo.


Tercer modelo multicontig
Tercer Modelo: secuencia en versión completa o borradorMulticontig:

  • Introduce la noción de buen enlace.

  • Este modelo tiene en cuenta:

    • Errores.

    • Orientación reconocida

    • Falta de cubrimiento

    • En algunos casos, repeticiones


Multicontig definiciones
Multicontig: Definiciones secuencia en versión completa o borrador

Llamaremos layout a un alineamiento múltiple de un conjunto de secuencias.

El siguiente layout será utilizado como ejemplo en varias definiciones:


Multicontig definiciones cont
Multicontig: Definiciones (cont.) secuencia en versión completa o borrador

Diremos que dos fragmentos fy g se solapan (y lo llamaremos overlap) si comparten una o más columnas en el layout. Es decir, si ambos string se intersecan.


Multicontig definiciones cont1
Multicontig: Definiciones (cont.) secuencia en versión completa o borrador

Podemos separar los overlaps en dos categorías:

  • Los que producen un enlace. (f3 – f4)

  • y los que no lo producen. (f2 – f5)


Multicontig definiciones cont2
Multicontig: Definiciones (cont.) secuencia en versión completa o borrador

  • El enlace más débil (weakest link) es aquél overlap con menor longitud que produce un enlace.

  • Diremos que un layout es un t-contig si el enlace más débil que posee tiene longitud t.

  • Si es posible obtener un t-contig de un conjunto de fragmentos F, diremos que F admite un t-contig.


Multicontig definici n i libre de errores
Multicontig: Definición I secuencia en versión completa o borradorLibre de Errores

Dado un conjunto de strings F y un entero t, particionar F en el mínimo número de subconjuntos Ci, 1 ≤ i ≤ k, tal que cada Ci admita un t-contig.


Multicontig ejemplos
Multicontig: Ejemplos secuencia en versión completa o borrador

Dado F = {GTAC, TAAG, TGTAA}


Multicontig contemplando errores
Multicontig: Contemplando errores secuencia en versión completa o borrador

  • Si se admiten errores en el acoplamiento, se debe obtener una cadena por consenso que será el resultado del ensamblamiento.

  • Diremos que S es una cadena -consensuada de F si, para cada cadena f en F, la distancia de edición entre f y su imagen en S es ≤ | f |.


Multicontig contemplando errores1
Multicontig: Contemplando errores secuencia en versión completa o borrador

Por ejemplo: S es una cadena 0.20 – consensuada con respecto a F.


Multicontig definici n ii admitiendo de errores
Multicontig: Definición II secuencia en versión completa o borradorAdmitiendo de Errores

Dado un conjunto de strings F, un entero t ≥ 0 y una tolerancia de error  entre 0 y 1, particionar F en el mínimo número de subconjuntos Ci, 1 ≤ i ≤ k, tal que cada Ci admita un t-contig con un consenso .


Multicoting resumen
Multicoting: Resumen secuencia en versión completa o borrador

  • Admite repeticiones en algunos casos.

  • Admite errores experimentales

  • Modela la orientación desconocida

  • Es un problema NP-Hard.


Tercera parte

Tercera Parte secuencia en versión completa o borrador

Algoritmos


Repaso de grafos
Repaso de Grafos secuencia en versión completa o borrador

  • Los grafos son artefactos matemáticos que permiten expresar de una forma visualmente sencilla y efectiva las relaciones que se dan entre elementos de muy diversa índole.


Repaso de grafos1
Repaso de Grafos secuencia en versión completa o borrador

  • Un grafo simple está formado por dos conjuntos:

    • Un conjunto V de puntos llamados vértices o nodos.

    • Un conjunto E de pares de vértices que se llaman aristas o arcos y que indican qué nodos están relacionados.

  • Notación: G(V,E)

x

y

x


Repaso de grafos2
Repaso de Grafos secuencia en versión completa o borrador

  • A los ejes se les puede asignar un peso. Notación: w(x,y)

  • Si hay más de un arco hablamos de un multigrafo

  • Si los arcos se recorren en una en una dirección concreta pero no en la contraria lo llamamos grafo dirigido o dígrafo y los arcos son aristas

8

y

x

y

x

y

x

y

x


Repaso de grafos3
Repaso de Grafos secuencia en versión completa o borrador

v1

v1

  • Un Camino es una secuencia de vértices V1, V2, V3, ... , Vn, tal que cada para uno de estos V1->V2, V2->V3, V1->V3

  • Un Camino Simple es cuando todos sus vértices, excepto tal vez el primero y el último son distintos.

  • Un Ciclo Simple es un camino simple de longitud por lo menos de uno que empieza y termina en el mismo vértice.

  • Se dice que un grafo es aciclíco cuando no contiene ciclos.

v2

v2

v3

v3

v4

v4

v1

v1

v2

v2

v3

v3


Representado el problema como un grafo
Representado el problema como un grafo secuencia en versión completa o borrador

  • Se representa con un grafo ya que resulta mas amigable para verlo visualmente, y se le esta aportando al problema, todo un conjunto de herramientas matemáticas para resolverlo.


Representado el problema como un grafo1
Representado el problema como un grafo secuencia en versión completa o borrador

  • Datos del problema:

    • Un conjunto de fragmentos FF = {ACTT, TTGTAA, AAGGT, TTGT, GTT, TTAG}

    • Un string SS = ACTTGTAAGGTTGTTAAG

    • El overlap de los fragmentosACTTTTGTAA


Representado el problema como un grafo2
Representado el problema como un grafo secuencia en versión completa o borrador

  • Datos del problema:

    • El orden en que se hace el overlapACTT TTGTAATTGTAA ACTT

    • La cantidad de nucleotidos que están en el overlapACTT TTGTAA 2 nucleótidos


Representado el problema como un grafo3
Representado el problema como un grafo secuencia en versión completa o borrador

  • Fragmentos son representados por los nodos o vértices.

  • Los overlap’s son representados por los ejes que unen a los nodos.

  • El orden del overlap de dos fragmentos, esta dado por la dirección del eje o arista.

  • La cantidad de nucleótidos que estan en el overlap de dos fragmentos, esta representado por el peso de los ejes.

  • El string s se representa como un camino en el grafo.


Representado el problema como un grafo4
Representado el problema como un grafo secuencia en versión completa o borrador

  • Ejemplo:

    • F={TACGA, ACCC, CTAAAG, GACA} a b c d

1

b

a

0

0

2

0

0

0

1

1

0

c

1

d

0


Representado el problema como un grafo5
Representado el problema como un grafo secuencia en versión completa o borrador

  • Ejemplo:

    • F={TACGA, ACCC, CTAAAG, GACA} a b c d

1

b

a

2

1

1

c

1

d


Representado el problema como un grafo6
Representado el problema como un grafo secuencia en versión completa o borrador

  • Ejemplo:

    • F={TACGA, ACCC, CTAAAG, GACA} a b c d

      S1= TACGACCCCTAAAGACA

      S2= TACGACACCCTAAAG

1

1

b

b

a

a

2

2

1

1

1

1

c

c

1

1

d

d


Representado el problema como un grafo7
Representado el problema como un grafo secuencia en versión completa o borrador

  • Problema: Encontrar el superstring mas corto. Esto es equivalente a encontrar un camino hamiltoniano máximo dentro del grafo. Este problema es NP-Completo


Algoritmos
Algoritmos secuencia en versión completa o borrador

  • GreedyAplica al modelo SCS y Reconstruction

  • Subgrafo AcíclicoAplica al modelo Multiconting


Algoritmo greedy
Algoritmo Greedy secuencia en versión completa o borrador

  • En cada paso intenta maximizar la solución del subproblema analizad. No retrocede una vez tomada cada decisión.


Algoritmo greedy1
Algoritmo Greedy secuencia en versión completa o borrador

  • Construimos un grafo dirigido a partir del multigrafo formado por los fragmentos de F, dejando entre cada par de nodos únicamente las aristas mas pesadas, ya que estamos buscando el camino mas pesado


Algoritmo greedy2
Algoritmo Greedy secuencia en versión completa o borrador

  • Entrada: Grafo orientado con n vértices.

  • Salida: Camino hamiltoniano en el grafo de entrada

    //Inicio

    Para i<-1 hasta n

    in[i] <-0 //cuantos ejes entran en i

    out[i] <-0 // cuantos ejes salen de i

    MakeSet(i)

    //Proceso

    Ordenar los ejes de acuerdo a a su peso, con el mas pesado primero

    Para cada eje (f,g) en ese orden

    Si in[g] = 0 y out[f] = 0 y FindSet(f) =/= FindSet(g)

    seleccionamos el eje (f,g)

    in[g] <- 1

    out[f] <- 1

    Union(FindSet(f), FindSet(g))

    Si queda una sola componente

    terminar

    Retornar los ejes seleccionados


Algoritmo greedy3
Algoritmo Greedy secuencia en versión completa o borrador

  • La solución encontrada es a lo sumo 2,75 veces peor que la optima, y se conjetura que lo es 2 veces.

  • Este algoritmo, no siempre encuentra una solución.

2

2

3

ATGC

GCC

TGCAT


Algoritmo subgrafo ac clico
Algoritmo Subgrafo Acíclico secuencia en versión completa o borrador

  • Este algoritmo restringe la hipótesis, asumiendo que los fragmentos están libres de errores, que se conoce la orientación y que fueron obtenidos de un buen secuenciamiento.

  • Se entiende por buen secuenciamiento, básicamente, a que los fragmentos cubren a la molécula en su totalidad y que se garantiza el overlap.


Algoritmo subgrafo ac clico1
Algoritmo Subgrafo Acíclico secuencia en versión completa o borrador

  • Dado un multigrafo con los fragmentos en los nodos, obtenemos un grafo dirigido, quedándonos con las aristas de mayor peso entre los nodos, ya que queremos encontrar el camino mas pesado.

  • Luego quitamos todas las aristas que tengan un peso menor al t-contig deseado. De forma tal que quede un subgrafo acíclico

  • Luego se busca un camino hamiltoniano máximo en el subgrafo acíclico. Esto es polinomial y se puede resolver con un algoritmo greedy.


Algoritmo subgrafo ac clico2
Algoritmo Subgrafo Acíclico secuencia en versión completa o borrador

  • Ejemplo:Consideremos que queremos llegar al string S y tenemos los fragmentos w, z, u, x e yS = AGTATTGGCAATCGATGCAAACCTTTTGGCAATCACTw = AGTATTGGCAATC z = AATCGATGu = ATGCAAACCTx = CCTTTTGGy = TTGGCAATCACTY se pide un t-contig de 3


Algoritmo subgrafo aciclico
Algoritmo Subgrafo Aciclico secuencia en versión completa o borrador

  • El subgrafo acíclico de de los overlap’s quedaría de la siguiente forma:

9

4

3

3

4


Heur stica
Heurística secuencia en versión completa o borrador

  • Buscar overlap

    • Para cada par de fragmentos, calcular el match prefijo-sufijo.

    • Usar el algoritmo de programación dinámica de alineamiento semiglobal sin penalidad.

  • Ordenar los fragmentos

    • Construir el camino con un algoritmo greedy o heurística

    • Cada camino tiene su correspondiente camino complementario

    • No es necesario incluir fragmentos incluidos en otros

    • Los ciclo y cubrimientos abundantes pueden indicar repeticiones.

  • Alineamiento y consenso


Bibliograf a
Bibliografía secuencia en versión completa o borrador

  • Brown, T. A., Genomes, 2002, 2nd. Edition, BIOS Scienfic Publishers, Ltd.

  • Griffiths A., Miller J., Suzuki D. & Lewontin R, An Introduction to Genetic Analysis, 2000, 7th ed. Freeman & Company

  • Meidanes

  • Prevner

  • Baxevanis


ad