Ce projet explore l’apprentissage par renforcement pour entraîner un bras robotique simulé à interagir dynamiquement avec des boîtes, en réponse à des événements complexes. En combinant l’environnement événementiel Open the Chests et la simulation physique avec PyBullet, l’agent apprend à identifier des séquences d’événements et à choisir de manière autonome la boîte adéquate à manipuler dans un contexte de prise de décision séquentielle.
-
PyBullet : Simulation physique du bras robotique.
-
Open the Chests (OtC) : Environnement événementiel pour l'entraînement du robot. Créé par nos professeures Sao Mai Nguyen et Ivelina Stoyanova.
-
Stable-Baselines3 (SB3)
-
PPO (Proximal Policy Optimization) – Apprentissage bras robotique.
-
DQN (Deep Q-Network)
-
GRU (Gated Recurrent Unit)
- Environnement de simulation : bras KUKA + 3 coffres.
- Espace d'action : translation 3D limitée pour stabilité.
- Contrôle moteur : cinématique inverse.
- Récompense : basée sur la distance et le contact avec la cible.
- Installer les dépendances :
pip install pybullet stable-baselines3 gym numpy matplotlibLily Daganaud, Candice Bouqin-Renoux, Sarah Garcia, Ines Lalou

