Skip to content

Adam-Blf/WalkingAI

Repository files navigation

LinkedIn Visitor Badge

Dernier commit Langage principal Nombre de langages

📝 Description

Simulation d'IA apprenant à marcher (Reinforcement Learning).

⚡ Fonctionnalités

  • Apprentissage par renforcement
  • Simulation physique
  • Réseaux de neurones

Construit avec les outils et technologies :

Python

🇫🇷 Français | 🇬🇧 Anglais | 🇪🇸 Espagnol | 🇮🇹 Italien | 🇵🇹 Portugais | 🇷🇺 Russe | 🇩🇪 Allemand | 🇹🇷 Turc

IA Marcheuse (Walking AI)

commits visites last commit top language license

Status Python Streamlit Gymnasium Render

Ce projet utilise l'apprentissage par renforcement (Reinforcement Learning) pour apprendre à un robot bipède à marcher.

Architecture

flowchart TB
    ENV["custom_env.py<br/>SimpleWalkerEnv · Gymnasium"]
    TRAIN["train.py<br/>PPO · stable-baselines3"]
    MODELS["models/PPO<br/>politiques sauvegardées"]
    VIZ["visualize.py<br/>rendu de l'agent entraîné"]
    DASH["streamlit_app.py<br/>dashboard · métriques"]
    DEPLOY["Render<br/>render.yaml · déploiement"]
    ENV --> TRAIN
    TRAIN --> MODELS
    MODELS --> VIZ
    MODELS --> DASH
    DASH --> DEPLOY
Loading

Prérequis

  1. Installer Python (si ce n'est pas déjà fait).
  2. Installer les dépendances :
    pip install -r requirements.txt
    Note : Sur Windows, l'installation de box2d peut parfois nécessiter des outils de compilation C++. Si vous avez une erreur, essayez d'installer swig via choco install swig ou téléchargez les binaires précompilés.

Comment utiliser

1. Entraînement (L'école)

Lancez le script d'entraînement pour que l'IA apprenne par essais et erreurs.

python train.py

L'IA va s'entraîner pendant 100 000 pas (environ 5-10 minutes selon votre PC). Les modèles seront sauvegardés dans le dossier models/PPO.

2. Visualisation (Le spectacle)

Une fois l'entraînement terminé, regardez le résultat :

python visualize.py

Une fenêtre s'ouvrira montrant le robot essayant de marcher (ou tombant avec style s'il n'a pas assez appris !).

Le Système de Punition/Récompense

L'environnement BipedalWalker-v3 donne des points à l'IA :

  • Récompense (+) : Avancer vers la fin du niveau.
  • Punition (-) : Tomber au sol (-100 points), utiliser trop de force moteur (coût énergétique).

L'IA cherche à maximiser son score total.


Par Adam Beloucif · Data Engineer & Fullstack Developer · GitHub · LinkedIn

Star History

Star History Chart

Releases

No releases published

Packages

 
 
 

Contributors