Fecha diseño: 2026-04-21 GPU: RTX 4060 8GB VRAM | VRAM confirmable libre: 7.4 GB
- Remote: https://github.com/Grizaceo/protein-lab
- Default branch (local actual):
master - Nota: el repo remoto se inicializó para versionar código, documentación y artefactos curados; datos pesados, outputs experimentales y material sensible deben seguir revisándose antes de trackearse.
ESMFold requiere ~16GB VRAM para cargar. En RTX 4060 (8GB), agota la memoria → WSL2 se cuelga → Ubuntu se bloquea completamente. NO USAR ESMFold.
| Modelo | Params | VRAM (embedding) | Uso |
|---|---|---|---|
| ESM2 8M | 7.5M | 0.03 GB | Embeddings rápidos, secuencias largas |
| ESM2 35M | 34M | 0.13 GB | Embeddings de buena calidad |
| ESM2 150M | 148M | 0.59 GB | Embeddings de alta calidad |
| ESM2 650M | 651M | 2.67 GB | Embeddings estado-del-arte |
- ESMFold (~16GB) — CRASHEA UBUNTU, no usar
- AlphaFold2 (completo) — borderline, puede funcionar con batch_size=1
- ColabFold + AlphaFold — requiere módulo alphafold instalable
Environment: protein-lab (conda)
Python: 3.10.20
GPU: RTX 4060 8GB, VRAM libre ~7.4 GB
Paquetes instalados:
- fair-esm 2.0.0 ✅ (ESM2 embeddings)
- colabfold 1.6.1 ✅ (sin alphafold, modo CPU/lite)
- openfold 2.2.0 (editable) ⚠️ (imports tienen problemas)
- torch 2.6.0+cu124 ✅
- jax 0.6.2 ✅
- Objetivo: Generar embeddings de secuencia proteica
- Entrada: Hemoglobina humana (P68871, 147 aa)
- Modelos: 8M, 35M, 150M, 650M
- VRAM: <3 GB total
- Estado: PENDIENTE
- Objetivo: PCA/t-SNE de embeddings ESM2
- Entrada: Resultados de Exp 1
- Estado: PENDIENTE
- Objetivo: Predicción de estructura sin AlphaFold
- Método: Modo
--custom-templateo búsqueda local - Nota: ColabFold sin alphafold es limitado, revisar docs
- Estado: REVISAR DOCUMENTACIÓN
- Objetivo: Predicción completa de estructura
- VRAM: ~6-7 GB con batch_size=1
- Requisito: Instalar alphafold desde repo (no pip)
- Precaución: Empezar con secuencias cortas, monitoriar VRAM
- Estado: FUTURO
- NUNCA correr ESMFold — crashea Ubuntu
- Antes de correr modelos grandes, verificar VRAM disponible con
nvidia-smi - Secuencias >500 aa: usar modelos pequeños (8M/35M) para embedding
- VRAM guard: si modelo requiere >7GB, no correr en la sesión activa de Hermes
- Monitoriar: después de cada experimento, verificar
torch.cuda.empty_cache()
source ~/.hermes/workspace/protein-lab/activate.shEste script activa el entorno conda protein-lab.