Abstrakt: RL-Toolkit: Návrh a implementácia súboru nástrojov pre posilňovanie učenia v robotike
Abstrakt: Tento článok predstavuje novú sadu nástrojov na samoučenie robotov v simulovaných prostrediach so zameraním na maximalizáciu skóre výkonu úloh. Navrhovaná metóda využíva umelú neurónovú sieť na transformáciu meraní senzorov na vektor akcií, t. j. pohybov motorov robota, pričom využíva princípy posilňovania učenia na maximalizáciu kvality stavových prechodov vyplývajúcich z vykonaných akcií. Na ukladanie údajov o interakciách získaných počas simulácií sa využíva databázový server Reverb. Experimentálne výsledky preukazujú výrazné zlepšenie o 9,38 % oproti publikovaným výsledkom pôvodných algoritmov. Konštrukcia RL-Toolkit pozostáva z databázového servera, nástroja na monitorovanie váh a odchýlok a podpory troch populárnych simulačných prostredí (Gymnasium, DeepMind Control Suite a PyBullet). Okrem toho sa uvádza návrh architektúry na použitie súpravy RL-Toolkit na reálnych robotoch, ktorý ukazuje jej potenciál na praktickú implementáciu. Viac ANS2023 – Book of Abstracts Kubovcik