Bases de Datos Fundamentales en Bioinformática

En bioinformática, las bases de datos son tu punto de partida. Aquí te presento las cuatro esenciales que todo bioinformático debe conocer.

10/9/20251 min read

NCBI: El ecosistema completo

El National Center for Biotechnology Information no es una sola base de datos, sino un conjunto de recursos interconectados:

  • GenBank: Millones de secuencias de ADN y ARN de miles de organismos

  • PubMed: Más de 35 millones de artículos científicos biomédicos

  • SRA: Datos brutos de secuenciación de nueva generación

  • Gene: Información completa sobre genes específicos (función, variantes, expresión)

Úsalo cuando: Necesites buscar secuencias, literatura científica o datos de secuenciación.

UniProt: El universo de las proteínas

La base de datos más completa sobre proteínas, dividida en dos secciones:

  • Swiss-Prot: Entradas revisadas manualmente por expertos (alta confiabilidad)

  • TrEMBL: Entradas automáticas sin revisar (mayor cobertura)

Úsalo cuando: Estudies función proteica, dominios, o busques proteínas similares entre especies.

PDB: Estructuras en 3D

El Protein Data Bank contiene estructuras tridimensionales de proteínas y ácidos nucleicos determinadas experimentalmente. Cada estructura incluye coordenadas atómicas, método experimental y resolución.

Úsalo cuando: Necesites visualizar estructuras, analizar sitios activos o hacer modelado molecular.

Extra: AlphaFold Database complementa PDB con predicciones de estructura por IA.

Ensembl: Genomas integrados

Proporciona genomas anotados de cientos de especies con datos integrados de múltiples fuentes:

  • Genes, transcriptos y proteínas anotados

  • Variantes genéticas

  • Relaciones evolutivas entre especies

  • BioMart: herramienta para consultas y descargas personalizadas

Úsalo cuando: Hagas genómica comparativa o necesites datos bien integrados de un genoma específico.

Tips rápidos

  1. Guarda los IDs únicos (accession numbers) de cada entrada

  2. Anota versiones y fechas de tus consultas para reproducibilidad

  3. Explora las conexiones: las bases de datos están interconectadas

  4. Aprende las APIs si necesitas consultas masivas

Para recordar

Estas cuatro bases de datos cubren el 90% de las necesidades básicas en bioinformática. Dominar su uso te ahorrará incontables horas de trabajo.