1-4-3. OpenAI Gym

1. Introduction to Deep Reinforcement Learning – LESSON 4 Learning Plan 

구경하다 여기 링크에서 OpenAI Gym이 제공하는 일부 환경을 살펴볼 수 있습니다.

OpenAI Gym에 대해 더 자세히 알고 싶으시면 GitHub 리포지토리를 살펴보세요. 이 블로그 게시물을 확인하여 OpenAI Gym을 사용하여 강화 학습(RL) 연구를 가속화하는 방법에 대해 자세히 알아보세요.

함으로써 배우기 nanodegree의 첫 번째 부분에서 우리는 이 툴킷의 일부로 사용할 수 있는 많은 환경을 사용할 것입니다.

얼어붙은 호수 환경을 통해 동적 프로그래밍에 대한 이해를 심화할 수 있습니다. 이 환경의 일부로 에이전트가 얼어붙은 물 구덩이에 빠지지 않고 세계를 탐색하도록 가르칠 것입니다. Monte Carlo 방법에 대해 배울 때 블랙잭을 플레이하는 에이전트를 작성합니다. 시간차 방법에 대한 수업의 일부로 에이전트에게 큰 절벽이 있는 세계를 탐색하도록 가르칠 것입니다. 여기서 목표는 빠지지 않는 것입니다! Solve OpenAI Gym의 Taxi-v2 Task 수업에서는 가능한 한 빨리 승객을 태우고 내리도록 택시를 훈련합니다. 연속 공간의 RL에서는 저전력 자동차를 훈련하여 큰 언덕을 관리하게 됩니다. OpenAI Gym의 정말 멋진 점 중 하나는 자신의 공연을 볼 수 있다는 것입니다. 따라서 에이전트는 무작위로 행동하기 시작할 수 있지만 상호 작용을 통해 학습하면서 훨씬 더 계산되고 지능적인 방식으로 작업을 선택하는 것을 볼 수 있습니다.

잘 훈련된 OpenAI 체육관 에이전트(출처)

또한 정말 멋진 점은 에이전트를 얼마나 똑똑하게 만들었는지 또는 에이전트가 얼마나 빨리 배우게 했는지에 만족한다면 구현을 업로드하여 지식을 전 세계와 공유할 수 있다는 것입니다! 각 작업에 대한 최상의 솔루션이 포함된 리더보드를 확인하세요.

설치 지침 컴퓨터에 OpenAI Gym을 설치할 필요는 없으며 교실 내에서 모든 코딩 구현을 수행할 수 있는 옵션이 있습니다.

컴퓨터에 OpenAI Gym을 설치하려면 GitHub 리포지토리의 지침을 따르는 것이 좋습니다.

질문 질문 다음 중 OpenAI 체육관에 대한 설명으로 옳은 것은? 사실에 모두 체크하세요.

%d 블로거가 이것을 좋아합니다: