PAM
Download
1 / 28

PAM - PowerPoint PPT Presentation


  • 104 Views
  • Uploaded on

PAM. Margaret Dayhoff. Accepted Point Mutations accepted by natural selection. Figura 1. Numbers of accepted point mutations. 260. Mutability of Amino Acids. Mutation probability matrix for the evolutionary distance of 1 PAM. 21.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' PAM' - sydnee-case


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Pam

PAM

Margaret Dayhoff


Pam

Accepted Point Mutations

accepted by natural selection.






Pam


Pam

  • Similarly the Tyr to Phe 1 PAM

  • 0.20/0.03 = 6.7 Log(6.7) = 0.83

  • 0.83 x 10 = 8.3

  • The average of 5.7 and 8.3 is 7

  • The number entered in the log odds table for changes between Phe and Tyr at 250 PAMs.


Pam 250
PAM 250 1 PAM


Matrices blosum henikoff and henikoff 1992
MATRICES BLOSUM 1 PAMHenikoff and Henikoff 1992

  • Matrices estadísticas se utilizan tanto para identificar las secuencias en la base de datos cómo para estimar su significancia biológica.


Pam

  • Los algoritmos de alineamientos local identifican las regiones compartidas por dos secuencias que son más similares entre sí.

  • Entonces, dominios de enlace de calcio homólogos embebido en proteínas no homólogas , exones en una secuencia genómica de ADN si se alinea con sus secuencia de ARNm.


Pam

  • " regiones compartidas por dos secuencias que son más similares entre sí. high-scoring segments pairs, HSPs".

  • Durante los procesos de búsqueda y extensión se hace uso de matrices de sustitución. Entonces las secuencias reportadas serán aquellas que posean los puntajes totales más altos ("maximal-scoring segment pair, MSP").


Blosum block amino acid substitution matrices
BLOSUM (Block amino acid Substitution Matrices) regiones compartidas por dos secuencias que son más similares entre sí.

  • Sin modelo evolutivo.

  • Bloques de secuencias. sin gaps que incluye homólogos lejanos

  • Basado en 2000 bloques de sec conservadas de aa, perteneciente a 500 fam relacionadas

  • Para BLOSUM n, las secuencias con identidad > de n% se agrupan y cuentan como una sola.

  • A mayor BLOSUM, menor distancia.

  • Típicas: BLOSUM 62, 50, 30.


Pam

  • matrices regiones compartidas por dos secuencias que son más similares entre sí. log odds (logaritmo base 2) de las frecuencias de pares que se presentan en la columnas de los bloques analizados:

    Sab = log (qab / еab)

    Frecuencia de ocurrencia de un aa se encuentre en un par :

    pi = qii + Σ qij/2

    i=j


Pam


Calculo de una matriz blosum ejemplo tomado y modificado de henikoff and henikoff 1992

GHGKKVAD regiones compartidas por dos secuencias que son más similares entre sí. ADLL

AHGKKVLGADGL

GHGKKVADADLL

AHGKKVLGADGL

GHGKKVADADLL

AHGKKVLGSDGL

GHGKKVADADLL

AHGKKVLGADGL

GHGKKVADADLL

AHGKKVLGADGL

bloque de secuencias (sección de una alineación local que no posee espacios)

calcula el número de pares posibles en una columna como no se conoce el aminoácido ancestral, se deben tomar todos los pares posibles. En el caso del ejemplo, existen 36 pares para AA (fAA) y 9 para SA (fAS).

Calculo de una matriz BLOSUM, ejemplo tomado y modificado de Henikoff and Henikoff 1992


Pam

  • Para calcular los valores de una matriz BLOSUM, necesitamos las frecuencias de los pares qab (ver formula), que en este caso qAA = fAA/(fAA+ fAS) = 36/36+9 = 0.8 y qAS = fAS/(fAA+ fAS) = 9/36+9 = 0.2

  • La frecuencia deque A se encuentre en par. pA = (qAA + qAS/2) = 0.8 + 0.2/2 = 0.9 y la frecuencia esperada de S es pS = (qAS/2) = 0.2/2 = 0.1

  • Así mismo, necesitamos conocer la frecuencia esperada de los pares AA y AS, la cual se calcula: eAA = PA x PA = 0.9 x 0.9 = 0.81 y eAS = 2 x PS x PA = 2 x 0.1 x 0.9 = 0.18


Pam

  • Por último, calculamos el las logaritmo (base 2) del radio de las frecuencias (qab / eab) y se multiplica por dos para trabajar con unidades de ½ de bit. En el ejemplo, SAA = log2 (qAA/eAA) = log2 (0.80/0.81) = -0.04 y SAS = log2 (qAS/eAS) = log2 (0.2/0.18) = 0.30


Pam

  • El resultado de todo esto es que, en BLOSUM62 vemos que D -> E (aspártico -> glutámico, ambos ácidos) tiene una puntuación positiva de +2, mientras que D -> L (aspártico -> leucina, ácido a hidrofóbico) tiene un valor negativo de -4. Esto nos indica que en los alineamientos utilizados para construir la matriz BLOSUM62, se observó con mayor frecuencia de la esperada el cambio D->E, no así el cambio D->L.


Pam


Filtros
FILTROS importante son el W (11), la C (9), la H (8), la P (7), etc. (

  • secuencias de baja complejidad (filtro SEG para aminoácidos y filtro DUST para nucleótidos: enmascara con X

  • secuencias repetitivas (filtro XNU): se aplica a secuencias con cortas repeticiones.

  • secuencias de coiled-coils (filtro COILS): se aplica a secuencias de coiled-coils. Éstas, al tener una periodicidad (suelen tener una Leu o una Ile cada 7 residuos) pueden dar buenas puntuaciones con otras proteínas que también adopten coiled-coils, sin que por ello compartan un origen evolutivo común (sin que sean homólogas).


Extras
Extras… importante son el W (11), la C (9), la H (8), la P (7), etc. (

  • valor por omisión del programa Blastn es de 11 letras  excluir homologos que divergen moderadamente, azar

  • FASTA que les permite ignorar (i.e. que no aparezcan en el output) secuencias altamente similares al query.

  • ktup en FASTA es el parámetro que indica el tamaño de la palabra utilizada en esta búsqueda inicial

  • FASTA utiliza por default ktup=2, mientras que BLAST utiliza ktup=3.

  • FASTA sólo considera identidades respecto a la palabra, mientras que BLAST utiliza identidades y sustituciones conservativas


Pam


Heur sticas de blast y fasta
Heurísticas de BLAST y FASTA repeticiones. FASTA no!

  • Estos métodos son muy rápidos. Básicamente utilizan los siguientes "truquillos":

  • tablas de dispersión: en lugar de representar una secuencia como tal, utilizan una tabla tal que:

  • posición   : 12345678901 secuencia X: TCAGACGATTG

  • Tabla de disperisón de X: A   3, 5, 8 C   2, 6 G   4, 7, 11 T   1, 9, 10


ad