1-4-3. OpenAI Gym

1. Introduction to Deep Reinforcement Learning – LESSON 4 Learning Plan 

오픈AI 체육관
이 과정에서는 강화 학습(RL) 알고리즘을 개발하고 비교하기 위해 OpenAI에서 만든 오픈 소스 툴킷인 OpenAI Gym을 광범위하게 사용할 것입니다. 이 툴킷을 사용하여 에이전트가 다양한 복잡한 작업을 수행하도록 가르칠 것입니다.

우리는 이를 사용하여 나노 학위 기간 동안 배울 많은 알고리즘으로 실용적이고 실습적인 기술을 구축할 것입니다. 그런 다음 이러한 환경에 대한 자신감을 키우면 프로젝트를 처리할 준비가 된 것입니다!

구경하다
여기 링크에서 OpenAI Gym이 제공하는 일부 환경을 살펴볼 수 있습니다.

OpenAI Gym에 대해 더 자세히 알고 싶으시면 GitHub 리포지토리를 살펴보세요. 이 블로그 게시물을 확인하여 OpenAI Gym을 사용하여 강화 학습(RL) 연구를 가속화하는 방법에 대해 자세히 알아보세요.

함으로써 배우기
nanodegree의 첫 번째 부분에서 우리는 이 툴킷의 일부로 사용할 수 있는 많은 환경을 사용할 것입니다.

얼어붙은 호수 환경을 통해 동적 프로그래밍에 대한 이해를 심화할 수 있습니다. 이 환경의 일부로 에이전트가 얼어붙은 물 구덩이에 빠지지 않고 세계를 탐색하도록 가르칠 것입니다.
Monte Carlo 방법에 대해 배울 때 블랙잭을 플레이하는 에이전트를 작성합니다.
시간차 방법에 대한 수업의 일부로 에이전트에게 큰 절벽이 있는 세계를 탐색하도록 가르칠 것입니다. 여기서 목표는 빠지지 않는 것입니다!
Solve OpenAI Gym의 Taxi-v2 Task 수업에서는 가능한 한 빨리 승객을 태우고 내리도록 택시를 훈련합니다.
연속 공간의 RL에서는 저전력 자동차를 훈련하여 큰 언덕을 관리하게 됩니다.
OpenAI Gym의 정말 멋진 점 중 하나는 자신의 공연을 볼 수 있다는 것입니다. 따라서 에이전트는 무작위로 행동하기 시작할 수 있지만 상호 작용을 통해 학습하면서 훨씬 더 계산되고 지능적인 방식으로 작업을 선택하는 것을 볼 수 있습니다.

잘 훈련된 OpenAI 체육관 에이전트(출처)

또한 정말 멋진 점은 에이전트를 얼마나 똑똑하게 만들었는지 또는 에이전트가 얼마나 빨리 배우게 했는지에 만족한다면 구현을 업로드하여 지식을 전 세계와 공유할 수 있다는 것입니다! 각 작업에 대한 최상의 솔루션이 포함된 리더보드를 확인하세요.

설치 지침
컴퓨터에 OpenAI Gym을 설치할 필요는 없으며 교실 내에서 모든 코딩 구현을 수행할 수 있는 옵션이 있습니다.

컴퓨터에 OpenAI Gym을 설치하려면 GitHub 리포지토리의 지침을 따르는 것이 좋습니다.

질문 질문
다음 중 OpenAI 체육관에 대한 설명으로 옳은 것은? 사실에 모두 체크하세요.

%d 블로거가 이것을 좋아합니다: