본문 바로가기

몽돌이 되는 과정 : )69

Lecture 3-2 : Dummy Q-learning ( 실습 ) 모두를 위한 딥러닝 - Deep Reinforcement Learning Python Language 의 장점은 우리가 그냥 적어놓는 글들을 고스란히 코딩으로 바꿔놓을 수 있다는 점이다. 따라서 왼쪽에 나와있는 글을 쉽게(?) 파이썬 코드로 바꿔보면 오른쪽과 같다. np.zeros ( 모든 Q를 0으로 만드러버린다. ) - 이때 0을 넣어줄 Space에 대한 Array 는 어떻게 만들어야 할까? 물론 직접 숫자 ( 16,4 ) 를 넣어줘도 되지만, 이미 알고 있는 환경이기도 하고 추후에 환경의 변화가 생겼을 때 조금 더 유연하게 대처하기 위해 [env.observation_space.n, env.action_space.n] 으로 나열해준다. 그리고 num_episodes = 2000은 에피소드의 개수를 의미한다. 그 다음에 왼쪽의 Observe current state s 는.. 2020. 1. 26.
Lecture 3-1 : Dummy Q-learning ( 이론 ) 모두를 위한 딥러닝 - Deep Reinforcement Learning Even if you know the way, just ask! Q라는 아이는 알려준다. 어느 방향으로 가는지에 따라 어떤 결과가 생길지에 대해 예측해준다. 너가 이런 상태(state)에서 이런 액션(action)을 하게 되면다면? 이런 결과(quality or reward)를 얻게 될 것이야. It called " Q-function / state-action value function / Q(state,action)" Policy using Q-function. We can choose the method how we can get reward higher and higher. 아무튼 우리가 각 방향에 따라 어떤 reward 가 생겼는지 알게되었을 때, 방향을 선택하게 되는데 무엇을 기준으로 하느냐!.. 2020. 1. 26.
10장 - 1/2 10. Dimensionality Reduction with Principal Component Analysis many dimensions are redundant and can be explained by a combination of other dimensions. Principal component analysis (PCA), an algorithm for linear dimensionality reduction. PCA - basis / basis change // projection // eigen-values // Gaussian distribution // constrained optimization. 10.1 problem setting. we are interested in findin.. 2020. 1. 20.
초보 개발자를 위한 자료 정리 002 - Python이란? 왜 python인가? Python For Beginners Welcome! Are you completely new to programming? If not then we presume you will be looking for information about why and how to get started with Python. Fortunately an experienced programmer in any programming language (whatever it may be) can pick up Python very quickly. It's also easy for beginners to use and learn, so jump in! 보통 저 처럼 프로그래밍에 익숙하지 않은 초보자에게도 충분히.. 2020. 1. 6.