🧬 PROTEIN LAB — Cristóbal

Fecha diseño: 2026-04-21 GPU: RTX 4060 8GB VRAM | VRAM confirmable libre: 7.4 GB

Repository

Remote: https://github.com/Grizaceo/protein-lab
Default branch (local actual): master
Nota: el repo remoto se inicializó para versionar código, documentación y artefactos curados; datos pesados, outputs experimentales y material sensible deben seguir revisándose antes de trackearse.

LECCIONES APRENDIDAS (21 abr 2026)

Causa de los crashes previos

ESMFold requiere ~16GB VRAM para cargar. En RTX 4060 (8GB), agota la memoria → WSL2 se cuelga → Ubuntu se bloquea completamente. NO USAR ESMFold.

Modelos ESM2 que SÍ funcionan en 8GB

Modelo	Params	VRAM (embedding)	Uso
ESM2 8M	7.5M	0.03 GB	Embeddings rápidos, secuencias largas
ESM2 35M	34M	0.13 GB	Embeddings de buena calidad
ESM2 150M	148M	0.59 GB	Embeddings de alta calidad
ESM2 650M	651M	2.67 GB	Embeddings estado-del-arte

Modelos que NO funcionan (requieren >8GB VRAM)

ESMFold (~16GB) — CRASHEA UBUNTU, no usar
AlphaFold2 (completo) — borderline, puede funcionar con batch_size=1
ColabFold + AlphaFold — requiere módulo alphafold instalable

STACK CONFIRMADO OPERATIVO

Environment: protein-lab (conda)
Python: 3.10.20
GPU: RTX 4060 8GB, VRAM libre ~7.4 GB

Paquetes instalados:
- fair-esm 2.0.0 ✅ (ESM2 embeddings)
- colabfold 1.6.1 ✅ (sin alphafold, modo CPU/lite)
- openfold 2.2.0 (editable) ⚠️ (imports tienen problemas)
- torch 2.6.0+cu124 ✅
- jax 0.6.2 ✅

EXPERIMENTOS DISEÑADOS

Exp 1: Embeddings de hemoglobina con ESM2 (SEGURA)

Objetivo: Generar embeddings de secuencia proteica
Entrada: Hemoglobina humana (P68871, 147 aa)
Modelos: 8M, 35M, 150M, 650M
VRAM: <3 GB total
Estado: PENDIENTE

Exp 2: Visualización de embeddings (SEGURA)

Objetivo: PCA/t-SNE de embeddings ESM2
Entrada: Resultados de Exp 1
Estado: PENDIENTE

Exp 3: ColabFold standalone (SEGURA - sin alphafold)

Objetivo: Predicción de estructura sin AlphaFold
Método: Modo --custom-template o búsqueda local
Nota: ColabFold sin alphafold es limitado, revisar docs
Estado: REVISAR DOCUMENTACIÓN

Exp 4: AlphaFold2 (BAJO RIESGO)

Objetivo: Predicción completa de estructura
VRAM: ~6-7 GB con batch_size=1
Requisito: Instalar alphafold desde repo (no pip)
Precaución: Empezar con secuencias cortas, monitoriar VRAM
Estado: FUTURO

REGLAS DE OPERACIÓN (CRÍTICAS)

NUNCA correr ESMFold — crashea Ubuntu
Antes de correr modelos grandes, verificar VRAM disponible con nvidia-smi
Secuencias >500 aa: usar modelos pequeños (8M/35M) para embedding
VRAM guard: si modelo requiere >7GB, no correr en la sesión activa de Hermes
Monitoriar: después de cada experimento, verificar torch.cuda.empty_cache()

Activate

source ~/.hermes/workspace/protein-lab/activate.sh

Este script activa el entorno conda protein-lab.

Name		Name	Last commit message	Last commit date
Latest commit History 65 Commits
automated_lab		automated_lab
colab_runs		colab_runs
data		data
exp01-hemoglobina		exp01-hemoglobina
experiments		experiments
investigacion-fibromialgia		investigacion-fibromialgia
next_run		next_run
replicacion_gse274134		replicacion_gse274134
reports		reports
scripts		scripts
simulations		simulations
src		src
tests		tests
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
DESIGN_ARTEFACT_V3_TRIPODE.md		DESIGN_ARTEFACT_V3_TRIPODE.md
DESIGN_ARTEFACT_V4B_ECCENTRIC.md		DESIGN_ARTEFACT_V4B_ECCENTRIC.md
DESIGN_ARTEFACT_V4_BIOSENSOR.md		DESIGN_ARTEFACT_V4_BIOSENSOR.md
GROUNDING.md		GROUNDING.md
HANDOFF_PARALIZACION.md		HANDOFF_PARALIZACION.md
HANDOFF_SESION.md		HANDOFF_SESION.md
LITERATURE_VERIFICATION_V4b.md		LITERATURE_VERIFICATION_V4b.md
PIPELINE_CLOUD_BINDER_DESIGN.md		PIPELINE_CLOUD_BINDER_DESIGN.md
PLAN_MAESTRO_RUTA_B.md		PLAN_MAESTRO_RUTA_B.md
README.md		README.md
SCOPE_A_MINIMAL.md		SCOPE_A_MINIMAL.md
SCOPE_B_MARCUS_ANALYSIS.md		SCOPE_B_MARCUS_ANALYSIS.md
SCOPE_B_PAPER_OUTLINE.md		SCOPE_B_PAPER_OUTLINE.md
SCOPE_C_HOPPING_GRAPH.py		SCOPE_C_HOPPING_GRAPH.py
SCOPE_C_NUMERIC_BIOSENSOR.md		SCOPE_C_NUMERIC_BIOSENSOR.md
SCOPE_C_REAL_GEOMETRY.py		SCOPE_C_REAL_GEOMETRY.py
SCOPE_C_RELAY_NETWORK.py		SCOPE_C_RELAY_NETWORK.py
activate.sh		activate.sh
add_line_numbers.py		add_line_numbers.py
adversarial_check.py		adversarial_check.py
au_np_redox_correction.py		au_np_redox_correction.py
audit_new_chassis.py		audit_new_chassis.py
audit_synapse.py		audit_synapse.py
audit_v4_real.py		audit_v4_real.py
check_circuit.py		check_circuit.py
clash_check_leu40.py		clash_check_leu40.py
conservation_analysis.py		conservation_analysis.py
design_ferritin_core.py		design_ferritin_core.py
destroyer.py		destroyer.py
diagnose_chains.py		diagnose_chains.py
elp_switch.py		elp_switch.py
environment.yml		environment.yml
find_deep_port.py		find_deep_port.py
find_docking_ports.py		find_docking_ports.py
find_gap_neighbors.py		find_gap_neighbors.py
find_manifold.py		find_manifold.py
find_mutation_point.py		find_mutation_point.py
find_mutation_point_v2.py		find_mutation_point_v2.py
geometry_cys_rotamer.py		geometry_cys_rotamer.py
lab_iterate.py		lab_iterate.py
logic_gate_test.py		logic_gate_test.py
logic_gate_v2.py		logic_gate_v2.py
moe_review.py		moe_review.py
optimize_core.py		optimize_core.py
parallel_lab.py		parallel_lab.py
process_colab_run.py		process_colab_run.py
run_analysis_v2.py		run_analysis_v2.py
run_comparison.py		run_comparison.py
sandwich_test.py		sandwich_test.py
scan_stones.py		scan_stones.py
simulate_bridge.py		simulate_bridge.py
simulate_bridge_v2.py		simulate_bridge_v2.py
switching_test.py		switching_test.py
tropical_metrics.py		tropical_metrics.py
validate_rigor.py		validate_rigor.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🧬 PROTEIN LAB — Cristóbal

Repository

LECCIONES APRENDIDAS (21 abr 2026)

Causa de los crashes previos

Modelos ESM2 que SÍ funcionan en 8GB

Modelos que NO funcionan (requieren >8GB VRAM)

STACK CONFIRMADO OPERATIVO

EXPERIMENTOS DISEÑADOS

Exp 1: Embeddings de hemoglobina con ESM2 (SEGURA)

Exp 2: Visualización de embeddings (SEGURA)

Exp 3: ColabFold standalone (SEGURA - sin alphafold)

Exp 4: AlphaFold2 (BAJO RIESGO)

REGLAS DE OPERACIÓN (CRÍTICAS)

Activate

About

Uh oh!

Releases 2

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🧬 PROTEIN LAB — Cristóbal

Repository

LECCIONES APRENDIDAS (21 abr 2026)

Causa de los crashes previos

Modelos ESM2 que SÍ funcionan en 8GB

Modelos que NO funcionan (requieren >8GB VRAM)

STACK CONFIRMADO OPERATIVO

EXPERIMENTOS DISEÑADOS

Exp 1: Embeddings de hemoglobina con ESM2 (SEGURA)

Exp 2: Visualización de embeddings (SEGURA)

Exp 3: ColabFold standalone (SEGURA - sin alphafold)

Exp 4: AlphaFold2 (BAJO RIESGO)

REGLAS DE OPERACIÓN (CRÍTICAS)

Activate

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases 2

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages