1 / 11

Para qué nos sirve comparar secuencias?

?. Para qué nos sirve comparar secuencias?. Para inferir la posible función de una proteína nueva. . Para la secuenciación de fragmentos muy largos de ADN (ordenamiento de contigs). . Para estudios filogenéticos. . ...fácil para el hombre, difícil para la computadora.

harley
Download Presentation

Para qué nos sirve comparar secuencias?

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ? Para qué nos sirve comparar secuencias? Para inferir la posible función de una proteína nueva. Para la secuenciación de fragmentos muy largos de ADN (ordenamiento de contigs). Para estudios filogenéticos.

  2. ...fácil para el hombre, difícil para la computadora.

  3. MSLFLGVRVRAEEAGARVQQNVPSGTDTGDPQSKPLGDWAAGTMDPESSIFIEDAIKYF KEKVSTQNLLLLTDNEAWNGFVAAAELPRNEADELRKALDNLARQMIMKDKNWHDKG QQYRNWFLKEFP RLKSKLEDNTRRLRALADGVQKVHKGTTIANVVSGSLSISSGILTLVG MGLAPFTEGGSLVLLEPGMELGITAALTGITSSTIDYGKKWWTQAQAHDLVIKSLDKLKE LLLPCIPLASTATRATPEQLRKCKFQQPWSKEKVSTQNLLLLTDNEAWNGFVAAAELPRN EADELRKALDNLARQMIMKDKNWHDKGQQYRNWFLKEFP RLKSKLEDNTRRLRALAD GVQKVHKGTTIANVVSGSLSISSGILTLVGMGLAPFTEGGSLVLLEPGMELGITAALTGITS STIDYGKKWWTQAQAHDLVIKSLDKLKEFLDCYHEKSD FPTYWIVIVGIINILSCTFF SITI YPTFNFGWNSPNALGY PQEPDEHIPL MEELQDDYEDMMEENLEQEEYEDPDIPESQMEEPAAHDTEATATDYHTTSHPGTHKVYVE LQELVMDEKNQELRWMEAARWVQLEENLGENGAWGRPHLSHLTFWSLLELRRVFTKGTV LLDLQETSLAGVANQLLDRFIFEDQIRPQDREELLRALLLKHSHAGELEALGGVKPAVLTRD PSQPLLPQHSSLETQLFCEQGDGGTEGHSPSGILEKI PPDSEATLVLVGRADFLEQPVLGFVR LQEAAELEAELPVPIRFLFVLLGPEAPHIDYTQLGRAAATLMS ERVFRIDAYM

  4. MSLFLGVRVRAEEAGARVQQNVPSGTDTGDPQSKPLGDWAAGTMDPESSIFIEDAIKYF KEKVSTQNLLLLTDNEAWNGFVAAAELPRNEADELRKALDNLARQMIMKDKNWHDKG QQYRNWFLKEFP RLKSKLEDNTRRLRALADGVQKVHKGTTIANVVSGSLSISSGILTLVG MGLAPFTEGGSLVLLEPGMELGITAALTGITSSTIDYGKKWWTQAQAHDLVIKSLDKLKE LLLPCIPLASTATRATPEQLRKCKFQQPWSKEKVSTQNLLLLTDNEAWNGFVAAAELPRN EADELRKALDNLARQMIMKDKNWHDKGQQYRNWFLKEFP RLKSKLEDNTRRLRALAD GVQKVHKGTTIANVVSGSLSISSGILTLVGMGLAPFTEGGSLVLLEPGMELGITAALTGITS STIDYGKKWWTQAQAHDLVIKSLDKLKEFLDCYHEKSD FPTYWIVIVGIINILSCTFF SITI YPTFNFGWNSPNALGY PQEPDEHIPL MEELQDDYEDMMEENLEQEEYEDPDIPESQMEEPAAHDTEATATDYHTTSHPGTHKVYVE LQELVMDEKNQELRWMEAARWVQLEENLGENGAWGRPHLSHLTFWSLLELRRVFTKGTV LLDLQETSLAGVANQLLDRFIFEDQIRPQDREELLRALLLKHSHAGELEALGGVKPAVLTRD PSQPLLPQHSSLETQLFCEQGDGGTEGHSPSGILEKI PPDSEATLVLVGRADFLEQPVLGFVR LQEAAELEAELPVPIRFLFVLLGPEAPHIDYTQLGRAAATLMS ERVFRIDAYM ...fácil para la computadora, difícil para el hombre!

  5. Alineamiento global r, s : cadenas originales r´, s´: cadenas aumentadas (con posibles gaps) • Un alineamiento global de las cadenas r y s es un alineamiento tal que: • long(r´) = long(s´) • para cada posición i se cumple que, o bien s´[i] no es un espacio o bien r´[i] no es un espacio. Score Una función de score es una función que confiere un valor a un alineamiento. GATCGGAATAG r : GA–CGGATTAG Match = +1 Mismatch= -1 Espacio= -2 s : Score(r,s) = 9 x 1 + 1 x (-1) + 1 x (-2) = 6 Similitud(r,s) = max Score (r,s) alig

  6. Para alinear s[1...i] con r[1...j] tenemos las siguientes alternativas: • alinear s[1...i] con r[1...j-1] y encolumnar un espacio con r[j] • alinear s[1...i-1] con r[1...j-1] y encolumnar s[i] con r[j] • alinear s[1...i-1] con r[1...j] y encolumnar s[i] con un espacio Sim(s[1...i], r[1...j-1]) - 2 Sim(s[1...i], r[1...j] ) = max Sim(s[1...i-1], r[1...j-1]) + score(s[i],r[j]) Sim(s[1...i-1], r[1...j]) - 2 En la matriz... M(i, j-1) - 2 M(i, j) = max M(i-1, j-1) + score(s[i],r[j]) M(i-1, j) - 2

  7. Matriz de similitud para el alineamiento entre AAAC y AGC A G C 0 -2 -4 -6 A -2 1 -1 -3 A -4 -1 0 -2 A -6 -3 -2 -1 C -8 -5 -4 -1

  8. Algoritmo para calcular la similitud entre dos cadenas Entrada: secuencias r y s Salida: similitud(r,s) Para i = 0 hasta long(r) hacer M[i,0] = i x score de un espacio Para j = 0 hasta long(s) hacer M[0,j] = j x score de un espacio Para i = 0 hasta long(r) hacer Para j = 0 hasta long(s) hacer M[i,j] = max de ( M[i-1] + Score de un espacio, M[i-1,j-1] + Score (s[i],r[j]), M[i,j-1] + Score de un espacio) Devolver M[long(r) , long(s) ]

  9. Alineamiento local Un alineamiento local de las cadenas r y s es un alineamiento global entre una subcadena de r con una subcadena de s. Para el alineamiento local la primera fila y la primera columna de la matriz de similitud M se inicializan con ceros. M(i, j-1) - 2 M(i-1, j-1) + score(s[i],r[j]) M(i, j) = max M(i-1, j) - 2 0

  10. Gaps Función de penalización de gaps: w(k) = c + g.k (k = long. del gap) a[i,j] = máximo score de un alineamiento entre r[1...i] y s[1...j ] que termina con r[i] encolumnado con s[j] b[i,j] = máximo score de un alineamiento entre r[1...i] y s[1...j ] que termina con un espacio encolumnado con s[j] c[i,j] = máximo score de un alineamiento entre r[1...i] y s[1...j ] que termina con r[i] encolumnado con un espacio

  11. Para 1  i  long(r) y para 1  j  long(s): a[i-1, j-1] a [i, j] = score(s[i],r[j]) + max b[i-1, j-1] c[i-1, j-1] a[i, j-1] – (c + g) a[i-1, j] – (c + g) b [i, j] = max c [i, j] = max b[i, j-1] – g b[i-1, j] – (c + g) c[i, j-1] – (c + g) c[i-1, j] – g b[i,0] = - para 1  i  long(r) b[0,j] = -(c + g.j) para 1  j  long(s) a[0,0] = 0 a[i,0] = - para 1  i  long(r) a[0,j] = - para 1  j  long(s) c[i,0] = -(c + g.j) para 1  i  long(r) c[0,j] = - para 1  j  long(s) Similitud(r,s) = max (a [m,n], b [m,n], c [m,n]) con m = long (r) n = long(s)

More Related