Eciwise IA - Predicción de rendimiento estudiantil

Servicio con arquitectura hexagonal en FastAPI que predice el rendimiento de un estudiante usando un ensamble de XGBoost + LightGBM + CatBoost entrenado con el CSV de entrada. Cada predicción se registra en PostgreSQL junto con el nombre del estudiante.

Nota de diagramas: los diagramas en Mermaid son vectoriales. En VS Code (Markdown Preview) y en GitHub puedes hacer zoom y pan para ver el detalle con claridad.

Arquitectura (hexagonal)

%%{init: {"theme": "base", "flowchart": {"curve": "linear"}} }%%
flowchart LR
  subgraph Inbound[Adapters de entrada]
    API[FastAPI /predictions]
  end

  subgraph Application[Aplicación]
    UseCase[PredictionService]
  end

  subgraph Domain[Dominio]
    Ports[Puertos\nModelPredictor\nPredictionRepository]
  end

  subgraph Outbound[Adapters de salida]
    ML[EnsemblePredictor\nXGBoost + LightGBM + CatBoost]
    DB[(PostgreSQL)]
  end

  API --> UseCase --> Ports
  Ports --> ML
  Ports --> DB

Diagrama de componentes

%%{init: {"theme": "base", "flowchart": {"curve": "linear"}} }%%
flowchart TB
  subgraph API
    Router[Routes]
    Schemas[Request/Response Schemas]
  end

  subgraph Application
    Service[PredictionService]
  end

  subgraph ML
    Trainer[Training Pipeline]
    Ensemble[Ensemble Predictor]
    Artifacts[(Model Artifacts)]
  end

  subgraph Persistence
    Repo[Prediction Repository]
    Table[(predictions)]
  end

  Schemas --> Router --> Service
  Service --> Ensemble
  Service --> Repo
  Trainer --> Artifacts
  Ensemble --> Artifacts
  Repo --> Table

Flujo de predicción

%%{init: {"theme": "base"}}%%
sequenceDiagram
  participant Client
  participant API
  participant Service
  participant Model
  participant DB

  Client->>API: POST /predictions
  API->>Service: valida y mapea datos
  Service->>Model: predict(features)
  Model-->>Service: GradeClass
  Service->>DB: INSERT prediction
  Service-->>API: respuesta
  API-->>Client: {name, prediction}

Requisitos

Python 3.10+
PostgreSQL 14+ (opcional si quieres persistencia)

Configuración rápida

Crear entorno virtual e instalar dependencias:

python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

Variables de entorno (ejemplo en .env.example):

export DB_ENABLED="true"
export DATABASE_URL="postgresql+psycopg2://postgres:postgres@localhost:5432/eciwise"
export DATASET_PATH="./ .csv"
export ARTIFACTS_DIR="artifacts"
export AUTO_TRAIN="false"

Entrenar modelos:
```
python scripts/train.py
```
Si prefieres entrenar automáticamente al iniciar la API, define AUTO_TRAIN=true.
Ejecutar API:
```
uvicorn app.main:app --reload
```

Si quieres ejecutar sin base de datos, define DB_ENABLED=false y el servicio no intentará guardar predicciones.

Dataset

El CSV debe contener las columnas:

Age, Gender, Ethnicity, ParentalEducation, StudyTimeWeekly, Absences, Tutoring,
ParentalSupport, Extracurricular, Sports, Music, Volunteering, GPA, GradeClass

El archivo provisto en este repositorio se llama " .csv" (tiene un espacio inicial). Por defecto DATASET_PATH apunta a ese nombre.

Endpoint de predicción

POST /predictions

{
  "student_name": "Andrea Ruiz",
  "age": 17,
  "gender": 1,
  "ethnicity": 2,
  "parental_education": 3,
  "study_time_weekly": 12,
  "absences": 3,
  "tutoring": 0,
  "parental_support": 3,
  "extracurricular": 1,
  "sports": 1,
  "music": 0,
  "volunteering": 1,
  "gpa": 3.4
}

Respuesta:

{
  "student_name": "Andrea Ruiz",
  "prediction": "B"
}

Nota: GPA NO se requiere en la entrada ya que es información posterior. El modelo predice basándose en características previas (hábitos, apoyo parental, actividades).

Logging

Cada predicción se registra en logs con el nombre del estudiante y la clase predicha para facilitar depuración.

Métricas del modelo

Al entrenar, se generan métricas completas por modelo en artifacts/metadata.json, incluyendo accuracy, balanced accuracy, precision/recall/F1 (micro, macro y weighted), log loss, matriz de confusión y classification report por clase.

Esquema de base de datos

El archivo schema.sql incluye el esquema necesario para la tabla predictions.

Estructura del proyecto

app/
  adapters/
    db/
    ml/
    web/
  application/
  domain/
  infrastructure/
scripts/
artifacts/

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
app		app
artifacts		artifacts
catboost_info		catboost_info
scripts		scripts
.env.example		.env.example
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
requirements.txt		requirements.txt
schema.sql		schema.sql

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Eciwise IA - Predicción de rendimiento estudiantil

Arquitectura (hexagonal)

Diagrama de componentes

Flujo de predicción

Requisitos

Configuración rápida

Dataset

Endpoint de predicción

Logging

Métricas del modelo

Esquema de base de datos

Estructura del proyecto

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Eciwise IA - Predicción de rendimiento estudiantil

Arquitectura (hexagonal)

Diagrama de componentes

Flujo de predicción

Requisitos

Configuración rápida

Dataset

Endpoint de predicción

Logging

Métricas del modelo

Esquema de base de datos

Estructura del proyecto

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages