Evaluatıon of DDPG and PPO Algorıthms for Bıpedal Robot Control

Home Page
About
Submit A Journal
Submit A Conference
Submit Paper/Book
- Submit a Preprint
- Submit a Book
Publisher/Editor Panel
- Sign In/Sign Up

Osmaniye Korkut Ata Üniversitesi Fen Bilimleri Enstitüsü Dergisi
Volume:5 Issue:2
Evaluatıon of DDPG and PPO Algorıthms for Bıpedal Robot Control

Evaluatıon of DDPG and PPO Algorıthms for Bıpedal Robot Control

Pages : 783-791

View : 19 | Download : 9

Publication Date : 2022-07-18

Article Type : Research Paper

Abstract :Bacaklı robotlar, zorlu arazilerde hareket edebilmeleri nedeniyle robotik alanında çalışılan popüler konulardan biridir. Bu çalışmada, ayaklı bir robot olan iki ayaklı bir robotun yürümesi amaçlanmıştır. Bu amaçla sistem incelenmiş ve bir yapay sinir ağı tasarlanmıştır. Daha sonra Derin Deterministik Politika Gradyanı insert ignore into journalissuearticles values(Deep Deterministic Policy Gradient - DDPG); ve Yakınsal Politika Optimizasyonu insert ignore into journalissuearticles values(Proximal Policy Optimization - PPO); algoritmaları kullanılarak sinir ağı eğitilmiştir. Eğitim sürecinden sonra PPO algoritması, DDPG algoritmasına göre daha iyi eğitim performansı oluşturulmuştur. Ayrıca, PPO algoritmasının en iyi gürültü standart sapması araştırılmıştır. Sonuçlar, en iyi sonuçların 0,50 kullanılarak elde edildiğini göstermiştir. Sistem, 0,50 gürültü standart sapmasına sahip PPO algoritmasını eğiten yapay sinir ağları kullanılarak test edilmiştir. Test sonucuna göre toplam ödül 274,334 olarak hesaplanmış ve amaçlanan yapı ile yürüme görevi gerçekleştirilmiştir. Sonuç olarak, mevcut çalışma, iki ayaklı bir robotun kontrol edilmesi ve PPO gürültü standart sapma seçiminin temelini oluşturmuştur.
Keywords : İki Ayaklı Robot, Derin Deterministik Politika Gradyanı, Yakınsal Politika Öğrenme, Pekiştirmeli Öğrenme

ORIGINAL ARTICLE URL

VIEW PAPER (PDF)