BLAST

BLAST
Desarrollador(es)
Altschul S.F., Gish W., Miller E.W., Lipman D.J., NCBI
http://www.ncbi.nlm.nih.gov/BLAST/
Información general
Última versión estable 2.2.25
31 de marzo de 2011
Género Herramienta Bioinformática
Sistema operativo UNIX, Linux, Mac OS X, MS-Windows
Licencia Dominio Público
En español No
[ editar datos en Wikidata]

BLAST (Basic Local Alignment Search Tool) es un programa informático de alineamiento de secuencias de tipo local, ya sea de ADN, ARN o de proteínas. El programa es capaz de comparar una secuencia problema (también denominada en la literatura secuencia query) contra una gran cantidad de secuencias que se encuentren en una base de datos. El algoritmo encuentra las secuencias de la base de datos que tienen mayor parecido a la secuencia problema. Es importante mencionar que BLAST usa un algoritmo heurístico por lo que no nos puede garantizar que ha encontrado la solución correcta. Sin embargo, BLAST es capaz de calcular la significación de sus resultados, por lo que nos provee de un parámetro para juzgar los resultados que se obtienen.

Normalmente el BLAST es usado para encontrar probables genes homólogos. Por lo general, cuando una nueva secuencia es obtenida, se usa el BLAST para compararla con otras secuencias que han sido previamente caracterizadas, para así poder inferir su función. El BLAST es la herramienta más usada para la anotación y predicción funcional de genes o secuencias proteicas. Muchas variantes han sido creadas para resolver algunos problemas específicos de búsqueda.

BLAST es desarrollado por los Institutos Nacionales de Salud del gobierno de EE. UU., por lo que es de dominio público y puede usarse gratuitamente desde el servidor del Centro Nacional para la Información Biotecnológica (NCBI). También está disponible para ser instalado localmente. Algunas ventajas de usar el servidor del NCBI son que el usuario no tiene que mantener ni actualizar las bases de datos y que la búsqueda se hace en un cluster de computadoras, lo que otorga rapidez. Las desventajas son: no se permiten hacer búsquedas masivas dado que es un recurso compartido, no se puede personalizar las bases de datos contra la que busca el programa, y las secuencias son enviadas al servidor del NCBI sin ningún tipo de cifrado, lo que puede ser un problema para quienes quieran mantener sus secuencias privadas. La aplicación local de BLAST tiene la ventaja de que permite manejar varios parámetros que en las búsquedas de NCBI están estandarizados, por lo que provee una mayor flexibilidad para los usuarios avanzados.


Algoritmo del BLAST

BLAST usa el algoritmo Smith-Waterman para realizar sus alineamientos[1]

BLAST usa una matriz de sustitución de aminoácidos o nucleótidos para calificar sus alineamientos. Dicha matriz contiene la puntuación (también llamada score) que se le da al alinear un nucleótido o un aminoácido X de la secuencia A con otro aminoácido Y de la secuencia B. Las matrices más usadas para calificar alineamientos de proteínas son la BLOSUM y la PAM (ambas fueron obtenidas midiendo la frecuencia de los aminoácidos en una gran muestra de proteínas). También se permite al usuario definir su propia matriz. El tipo de matriz usada es determinante para los resultados que se obtendrán, el uso de una matriz incorrecta puede llevar a calificar erróneamente los alineamientos y por lo tanto obtener resultados equivocados.

El algoritmo de BLAST tiene tres etapas principales: ensemillado, extensión y evaluación. A continuación se describen brevemente cada una de ellas:

Primera etapa: ensemillado o seeding.

En esta etapa se buscan "palabras" pequeñas en las secuencias de la base de datos, que corresponden a fragmentos de la secuencia problema. BLAST asume que los alineamientos significativos deben contener estas palabras. Sólo se consideran significativas las palabras que tengan una puntuación mayor a T (T es un parámetro que se pueda modificar al usar el programa) y que se encuentren al menos a una distancia A de otra palabra. W es otro parámetro usado por BLAST y se refiere al tamaño de las palabras a buscar. Ajustando los parámetros T, A y W se puede escoger entre hacer un alineamiento sensible pero lento, o uno más rápido pero con menor sensibilidad.

Segunda etapa: extensión.

Una vez obtenidas las palabras que cumplen con los criterios dados, se pasa a la etapa de extensión. En esta etapa el alineamiento se va extendiendo a ambos lados de las palabras. La extensión realizada en este punto se realiza haciendo uso del algoritmo de Smith-Waterman. BLAST va extendiendo el alineamiento hasta que la puntuación del alineamiento descienda X o más puntos con respecto a la puntuación más alta obtenida anteriormente. Aquí reside el factor heurístico del BLAST, ya que al imponer el límite X, evita extender a lo largo de toda la secuencia todos los alineamientos (proceso que llevaría demasiado tiempo). El peligro que esto conlleva es que el programa se puede quedar atorado en un máximo local. Es por ello que la definición de X es determinante para el resultado.

Tercera etapa: evaluación

Una vez terminada la extensión de todas las palabras, cada uno de los alineamientos realizados es evaluado para determinar su significación estadística. Para ello, el programa elimina los alineamientos inconsistentes (alineamientos que junten la misma parte de la secuencia problema con distintas partes de una secuencia en la base de datos). Los alineamientos resultantes son llamados pares de alta puntuación (High Score Pairs o HSPs, por sus siglas en inglés). Una vez realizado esto, se calcula la puntuación final de los alineamientos resultantes y se determina su significación tomando en cuenta la probabilidad que tiene dicho alineamiento de haber sido obtenido por azar de acuerdo al tamaño de la base de datos. Al final se reportan sólo los alineamientos que hayan obtenido una probabilidad menor a E. El parámetro E es conocido como e-valor (e-value) de corte, y nos permite definir qué alineamientos queremos obtener de acuerdo a su significación estadística. Cuanto menor sea el valor de E, más significativo es un alineamiento.

Other Languages
català: BLAST
čeština: BLAST
English: BLAST
eesti: BLAST
فارسی: بلاست
íslenska: BLAST
日本語: BLAST
Nederlands: BLAST
norsk bokmål: Blast
polski: BLAST
português: BLAST
русский: BLAST
српски / srpski: BLAST
svenska: BLAST
Türkçe: BLAST
Tiếng Việt: BLAST