J mol biol 1990 403 410
This presentation is the property of its rightful owner.
Sponsored Links
1 / 48

J. Mol. Biol. (1990), 403-410 PowerPoint PPT Presentation


  • 89 Views
  • Uploaded on
  • Presentation posted in: General

Uno de los artículos científicos más citados de la historia de la biología molecular. J. Mol. Biol. (1990), 403-410. B asic L ocal A lignment S earch T ool. E s la herramienta de software más importante de la Bioinformática porque:.

Download Presentation

J. Mol. Biol. (1990), 403-410

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


J mol biol 1990 403 410

Uno de los artículos científicos más citados de la historia de la biología molecular.

J. Mol. Biol. (1990), 403-410


J mol biol 1990 403 410

Basic Local Alignment Search Tool

Es la herramienta de software más importante de la Bioinformática porque:

1.- La comparación de secuencias permite obtener información sobre secuencias desconocidas

2.- Es un método rápido

3.- Es un método fiable, tanto por la solidez de su análisis estadístico como por el grado de desarrollo del software

4.- Es un método flexible, que permite comparar secuencias en múltiples escenarios

5.- Es una herramienta consolidada y de uso generalizado, ya que cualquier persona con un ordenador conectado a Internet la puede utilizar

Características del programa BLAST


J mol biol 1990 403 410

Mapping – ID – Exploring

Usos de BLAST


J mol biol 1990 403 410

BLAST compara una secuencia problema (query sequence) de nucleótidos o de proteínas con todas las secuencias de una BD para encontrar regiones de similitud local. Al mismo tiempo calcula la significación estadística de cada resultado. Permite inferir relaciones funcionales y evolutivas, así como identificar miembros de una familia de genes o de proteínas.

¿ Para qué sirve BLAST ?


J mol biol 1990 403 410

Menú de BLAST

Selecciona la versión de BLAST que vas a utilizar

Opciones avanzadas de BLAST

http://blast.ncbi.nlm.nih.gov/Blast.cgi


J mol biol 1990 403 410

Versiones básicas de BLAST (1)


J mol biol 1990 403 410

Versiones especializadas de BLAST


J mol biol 1990 403 410

Para hacer una búsqueda con BLAST (NCBI)

1.- http://blast.ncbi.nlm.nih.gov/Blast.cgi

2.- Escoge una versión del programa BLAST

3.- Introduce la secuencia problema

4.- Selecciona la base de datos

5.- Selecciona el algoritmo adecuado a la búsqueda

5.- Selecciona los parámetros de la búsqueda

6.- ¡BLAST!

7.- Analiza los resultados

¿ Cómo se hace una búsqueda con BLAST ?


J mol biol 1990 403 410

1.- Escoge la versión del programa BLAST adecuada


J mol biol 1990 403 410

Formulario de búsqueda en BLASTP


J mol biol 1990 403 410

1.- Teclea la secuencia completa

2.- Pega una secuencia en formato FASTA

3.- Introduce el identificador de la secuencia

Opciones

2.- Introduce la secuencia problema


J mol biol 1990 403 410

Menú desplegable para seleccionar la BD

Botones de ayuda

3.- Selecciona la BD y organismo


J mol biol 1990 403 410

BLASTP

BLASTN

4.- Selecciona el algoritmo adecuado


J mol biol 1990 403 410

La selección de los parámetros condiciona notablemente los resultados de la búsqueda

Si no lo tienes claro, utiliza los parámetros que aparecen por defecto

5.- Selecciona los parámetros de la búsqueda


J mol biol 1990 403 410

6.- Inicia la búsqueda


J mol biol 1990 403 410

La búsqueda se está realizando…


J mol biol 1990 403 410

Se puede cambiar el formato de presentación de los resultados.

Más información.

Después del encabezamiento, los resultados aparecen divididos en tres grandes bloques: en forma de gráfico, en una tabla que describe las secuencias encontradas y en forma de alineamiento.

7.- Página con los resultados de la búsqueda


J mol biol 1990 403 410

Opciones para cambiar el formato


J mol biol 1990 403 410

Página de resultados: encabezamiento


J mol biol 1990 403 410

Página de resultados: el gráfico


J mol biol 1990 403 410

Enlaces a la BD Protein del NCBI

Página de resultados: la tabla


J mol biol 1990 403 410

http://www.ncbi.nlm.nih.gov/BLAST/tutorial/Altschul-1.html

La estadística que hay detrás de BLAST


J mol biol 1990 403 410

Página de resultados: los alineamientos


J mol biol 1990 403 410

Estructuras relacionadas


J mol biol 1990 403 410

Si no quieres trabajar conectado a Internet para preservar la confidencialidad de los datos, puedes descargarte el programa y las BD para instalarlos en un ordenador personal.

Puedes descargar gratuitamente el programa y las BD de BLAST


J mol biol 1990 403 410

ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/

Directorio de descargas del programa BLAST


J mol biol 1990 403 410

ftp://ftp.ncbi.nlm.nih.gov/blast/db/

Directorio de descargas de las BD de BLAST


J mol biol 1990 403 410

http://www.ncbi.nlm.nih.gov/books/NBK1762/

Instalación del programa

Comandos para usar el programa

Puedes descargar el manual de uso de BLAST


J mol biol 1990 403 410

(Protein)

(Protein)

(Protein)

(Protein)

Versiones básicas de BLAST (2)


J mol biol 1990 403 410

Hay tres buenas razones para comparar secuencias a nivel de proteína en vez de a nivel de nucleótidos:

1.- El código genético está degenerado: secuencias de nucleótidos aparentemente muy distintas pueden codificar la misma proteína.

2.- Las secuencias de proteínas contienen más información (4,32 bits por residuo) que las secuencias de nucleótidos (2 bits por residuo). Esto implica que con secuencias proteicas se pueden obtener resultados significativos con alineamientos más cortos.

3.- Las matrices de sustitución (PAM, BLOSUM) utilizadas para puntuar alineamientos de proteínas son mucho más sofisticadas que las utilizadas para alinear nucleótidos y reflejan mucho mejor la similitud biológica entres dos secuencias.

Lógicamente, las secuencias no codificantes sólo se pueden comparar a nivel de nucleótidos.

¿Para qué traducir las secuencias de nucleótidos?


J mol biol 1990 403 410

Se suele utilizar para:

1.- Identificar una proteína (el parecido es del 100%)

2.- Identificar proteínas homólogas

3.- Seleccionar proteínas homólogas de varios organismos para hacer alineamientos múltiples de secuencia o análisis filogenéticos

4.- Identificar regiones comunes en proteínas distintas (dominios conservados)

BLASTP


J mol biol 1990 403 410

BLASTP


J mol biol 1990 403 410

Se suele utilizar para:

1.- Localizar en un genoma oligonucleótidos, cDNA, EST, productos de PCR o elementos repetitivos

2.- Identificación de secuencias de DNA y anotación del DNA genómico

3.- Localizar secuencias homólogas en otras especies (genes de RNA o proteínas, regiones reguladoras, etc.)

4.- Generación de contigs a partir de las lecturas cortas obtenidas durante la secuenciación

5.- Eliminar subsecuencias pertenecientes a vectores

6.- Detectar otros tipos de contaminación

BLASTN


J mol biol 1990 403 410

When a query sequence is searched against a database, both strands of the query are examined. The plus strand is the sequence in the FASTA file. The minus strand is the reverse complement of this sequence.

If the similarity between the query and subject sequences is on the same strand, both sequences are labeled as being on the plus strand and the coordinates increase from left to right. Even if an alignment is labeled as "Plus/Plus," the encoded gene may be on the minus strand.

When the minus strand of the query sequence is similar to a database sequence, the alignment is reported with either the subject or query sequence in reversed coordinates. In NCBI-BLAST, the database sequences are flipped, but in WU-BLAST, the query coordinates are flipped.

Las hebras Plus y Minus


J mol biol 1990 403 410

NCBI-BLAST (same strand)

NCBI-BLAST (different strand)

WU-BLAST (different strand)

Las hebras Plus y Minus


J mol biol 1990 403 410

BLASTX se utiliza cuando se tiene sospecha de que la secuencia de nucleótidos codifica una proteína

Se suele utilizar para:

1.- Localizar genes que codifican proteínas en el DNA genómico

2.- Determinar si un transcrito (en forma de cDNA o EST) corresponde a una proteína conocida

3.- Distinguir las regiones codificantes y no codificantes de un mRNA

BLASTX


J mol biol 1990 403 410

Alignments from BLASTX are complicated by both strand and reading frame. The query sequence is translated in three frames on both the plus and minus strands. With three nucleotides per codon, the coordinates of the query sequence increase by threes. Minus strand matches invert the query coordinates.

BLASTX


J mol biol 1990 403 410

BLASTX


J mol biol 1990 403 410

TBLASTN se usa cuando el análisis con BLASTP no ha tenido éxito porque la proteína no aparece en las BD

Se suele utilizar para:

1.- Localizar una proteína en el DNA genómico

2.- Localizar exones en el DNA genómico

3.- Identificar los transcritos (en forma de cDNA o EST) de organismos poco caracterizados, que puedan corresponder a la proteína problema o a una proteína homóloga

TBLASTN


J mol biol 1990 403 410

TBLASTN


J mol biol 1990 403 410

TBLASTN


J mol biol 1990 403 410

TBLASTX se utiliza para encontrar genes difíciles de encontrar mediante métodos convencionales

Se suele utilizar para:

1.- Descubrir en el DNA genómico nuevos genes (en la misma especie o en especies distintas) que no han sido encontrados por métodos tradicionales (genes dentro de genes, procesamientos alternativos o genes con bajo nivel de expresión)

2.- Descubrir transcritos (en forma de cDNA o EST) cuyos productos aún no están en las BD de proteínas

TBLASTX


J mol biol 1990 403 410

6 pautas de lectura posibles en cada secuencia


J mol biol 1990 403 410

TBLASTX


J mol biol 1990 403 410

TBLASTX


J mol biol 1990 403 410

Algunas recomendaciones


  • Login