1. Introduction to Deep Reinforcement Learning – LESSON 1 Welcome to Deep Reinforcement Learning
Welcome to the Deep Reinforcement Learning Nanodegree program.
We’re so excited that you’ve joined us.
I’m Alexis Cook, the curriculum lead for this program.
I’ll be your guide through the Nanodegree.
Your journey through the fascinating world of
deep reinforcement learning will start at the very beginning.
So we’ll begin by answering the question,
what is deep reinforcement learning exactly?
Well, reinforcement learning is ultimately about
building code that can learn to perform complex tasks by itself,
and deep reinforcement learning refers to approaches
where the knowledge is represented with a deep neural network.
For example, maybe you’ve heard about AlphaGo Zero,
the computer program that’s able to beat
world champions at the ancient Chinese game of Go.
AlphaGo Zero learned for itself how to play without being told any rules of the game.
It just starts playing and then based on whether it has won or lost,
it can assess how good it’s strategy is.
Reinforcement learning helps AlphaGo Zero to learn from
this gameplay experience so that it’s able to learn from those wins and losses,
to propose gradually better strategies and eventually master the game.
This trial and error approach can also be extended to other domains.
For instance, to teach a robot to
walk or train a chatbot how to have better conversations.
Companies such as Uber and Google are actively
testing reinforcement learning algorithms and their self-driving cars,
and Amazon currently uses reinforcement learning to make their warehouses more efficient.
The possibilities are truly endless and It’s widely considered
the technology that brings us closer than never to artificial general intelligence.
While we’re still quite far from developing
a super-human computer that matches human intelligence,
the algorithms you’ll learn in this course are
logical first step in this direction and that’s why we built this program,
so that you’re able to master this fascinating and potentially world changing technology.
We can’t wait to see where this journey takes you.
Deep Reinforcement Learning Nanodegree 프로그램에 오신 것을 환영합니다.
우리는 당신이 우리와 함께하게되어 매우 기쁩니다.
저는 이 프로그램의 커리큘럼 책임자인 Alexis Cook입니다.
나는 Nanodegree를 통해 당신의 가이드가 될 것입니다.
매혹적인 세계로의 여행
심층 강화 학습은 처음부터 시작됩니다.
질문에 답하는 것으로 시작하겠습니다.
심층 강화 학습이 정확히 무엇인가요?
강화 학습은 궁극적으로
복잡한 작업을 스스로 수행하는 방법을 배울 수 있는 빌드 코드,
심층 강화 학습은 접근 방식을 나타냅니다.
여기서 지식은 심층 신경망으로 표현됩니다.
예를 들어 AlphaGo Zero에 대해 들어본 적이 있을 것입니다.
이길 수 있는 컴퓨터 프로그램
고대 중국 바둑의 세계 챔피언.
AlphaGo Zero는 게임의 규칙을 듣지 않고 게임하는 방법을 스스로 배웠습니다.
그냥 게임을 시작한 다음 승패에 따라
얼마나 좋은 전략인지 평가할 수 있습니다.
강화 학습은 AlphaGo Zero가 학습하는 데 도움이 됩니다.
이 게임 플레이 경험을 통해 승패로부터 배울 수 있습니다.
점차적으로 더 나은 전략을 제안하고 궁극적으로 게임을 마스터합니다.
이 시행착오 방식은 다른 영역으로 확장될 수도 있습니다.
예를 들어 로봇을 가르치기 위해
챗봇을 걷거나 훈련시켜 더 나은 대화를 하세요.
우버, 구글 등 기업들이 적극적으로
강화 학습 알고리즘과 자율 주행 자동차 테스트,
Amazon은 현재 강화 학습을 사용하여 창고를 더 효율적으로 만들고 있습니다.
가능성은 정말 무한하며 널리 고려됩니다.
인공 일반 지능에 우리를 더 가까이 데려다주는 기술.
아직 발전하려면 멀었지만
인간의 지능과 일치하는 초인간 컴퓨터,
이 과정에서 배우게 될 알고리즘은
이 방향의 논리적인 첫 번째 단계이며 이것이 우리가 이 프로그램을 만든 이유입니다.
여러분이 이 매혹적이고 잠재적으로 세계를 변화시키는 기술을 마스터할 수 있도록.
이 여정이 여러분을 어디로 데려갈지 무척 기대됩니다.