IK_RL

Multi-Agent Proximal Policy Optimization (MAPPO) for Inverse Kinematics

Project Overview

This project implements a Multi-Agent Proximal Policy Optimization (MAPPO) algorithm to solve inverse kinematics problems for robotic arms. The system uses PyBullet for physics simulation and PyTorch for deep learning.

Key Components

1. Environment (`InverseKinematicsEnv`)

Custom OpenAI Gym environment
Simulates a robotic arm (default: KUKA IIWA) in PyBullet
Handles state observations, action applications, and reward calculations

2. MAPPO Agent (`MAPPOAgent`)

Implements the MAPPO algorithm
Manages multiple agents, one for each joint of the robotic arm
Uses a centralized critic and decentralized actors

3. Neural Network Models

Actor Network (`JointActor`)

Predicts action mean and standard deviation for each joint
Uses tanh activation for bounded actions

Critic Network (`CentralizedCritic`)

Estimates the value function for the entire state

4. Training Process

Episodic training loop
Collects trajectories and updates policy using PPO
Implements Generalized Advantage Estimation (GAE)
Uses separate learning rates and clip parameters for each joint

5. Metrics and Logging (`TrainingMetrics`)

Tracks various performance metrics during training
Generates plots and saves logs for analysis

Key Features

Multi-agent approach for controlling individual joints
Centralized training with decentralized execution
Dynamic difficulty adjustment during training
Best model saving based on joint error performance
Comprehensive logging and visualization of training metrics

Usage

Configure the environment and training parameters in config.py
Run the main training script: main.py
Monitor training progress through logged metrics and generated plots
Use the trained model for testing or deployment

Dependencies

PyTorch
PyBullet
OpenAI Gym
NumPy
Matplotlib

Future Improvements

Implement more advanced exploration strategies
Add support for different robot models
Optimize hyperparameters for better performance
Implement multi-task learning for various IK problems

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
.vscode		.vscode
__pycache__		__pycache__
ik_solver		ik_solver
ur5		ur5
xarm		xarm
README.md		README.md
agent_tester.py		agent_tester.py
config.py		config.py
main.py		main.py
test.py		test.py
test_agent.py		test_agent.py
training_metrics.json		training_metrics.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

IK_RL

Multi-Agent Proximal Policy Optimization (MAPPO) for Inverse Kinematics

Project Overview

Key Components

1. Environment (`InverseKinematicsEnv`)

2. MAPPO Agent (`MAPPOAgent`)

3. Neural Network Models

Actor Network (`JointActor`)

Critic Network (`CentralizedCritic`)

4. Training Process

5. Metrics and Logging (`TrainingMetrics`)

Key Features

Usage

Dependencies

Future Improvements

About

Releases

Packages

Languages

boelnasr/IK_RL

Folders and files

Latest commit

History

Repository files navigation

IK_RL

Multi-Agent Proximal Policy Optimization (MAPPO) for Inverse Kinematics

Project Overview

Key Components

1. Environment (InverseKinematicsEnv)

2. MAPPO Agent (MAPPOAgent)

3. Neural Network Models

Actor Network (JointActor)

Critic Network (CentralizedCritic)

4. Training Process

5. Metrics and Logging (TrainingMetrics)

Key Features

Usage

Dependencies

Future Improvements

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

1. Environment (`InverseKinematicsEnv`)

2. MAPPO Agent (`MAPPOAgent`)

Actor Network (`JointActor`)

Critic Network (`CentralizedCritic`)

5. Metrics and Logging (`TrainingMetrics`)

Packages