멀티프로세스 REINFORCE 알고리즘 구현

잡담

나도 블로그에 사람들이 많이 들어왔으면 좋겠다… 강화학습 얘기 하면 사람들 많이 들어올까… 근데 난 강화학습을 잘 몰라… 어떡하지….

목적

Rollout을 여러 프로세스에서 동시에 진행시키고 싶은데, REINFORCE의 가정은 깨고싶지 않다. 다른 distributed 환경을 위해 만들어진 알고리즘(A3C, PPO)와 같은 경우, A3C는 아마 rollout하는 policy들의 parameter가 다름을 감안하고 만든 알고리즘(인 것 ) 같고, PPO는 잘 모르겠지만, 암튼, Pytorch로 간단하게 Reinforce 알고리즘을 구현하고 싶었다....

Learning Scheduling Algorithms for Data Processing Clusters 리뷰

잡담

최근에 연구실에 들어가면서, 공부하는 주제가 바뀌게 되었다. 사실 내가 연구라고 말할 걸 하고 있지는 않지만(하고는 싶지만) ‘ㅅ’….공부하는 것들이 낯설다. 낯선 주제이므로, 논문 읽는데 시간이 많이 걸리기도 하고, 뭘 읽어야 하는지도 모르겠고…라는 핑계를 대며 이리저리 놀고만 있었는데, 그러면 안될 것 같다.

개요

RL은 정말 많은 일을 잘 할 수 있다고 많이 밝혀지고 있다. 현재는 주로 로보틱스나 게임이지만. 하지만 RL을 Traditional한 환경에 적용할 수 있다고 믿는 사람이 많다. 내 지도교수님도 그렇게 생각한다. 나도 조금은, 그렇게 생각하게 되었다.

이 논문은, 강화학습을 Cluster Scheduling에 대해 적용한 논문이다. Scheduling은 보통, job을 machine에 할당하는 일이다. (나는 잘 모르겠지만, Click to read more ...

Einsum에 대해 간략한 정리

Einsum Notation

Note

Pytorch나 Tensorflow 내의 많은 글들이 외우기 너무너무너무 진짜 외우기도 어렵고, 쓰기도 어려워서, 쉽게 표현할 방법이 없나 찾아보다 정리한 글입니다. 기본적으로, Einsum is All You Need 이 글을 많이 참조했습니다.

Introduction

PyTorch, Tensorflow 내의 다양한 함수(Dot Products, Outer Products, Transposes ,matrix-vector, 아니면 matrix-matrix multiplication)들의 name과 signature을 외우기 어렵지 않은가? 이 글을 읽는 사람이 나와 비슷하...

Click to read more ...

Why Learning is a New Procrastination

Max Lukominskyi의 post가 공감이 가서 번역해봤습니다.

잡담

이것 배우고 시작해야지, 저것 배우고 시작해야지, 혹은 남의 글만 읽고 “이제 충분해”라고 생각하고 실천은 저 너머로 날려버린 나에게, 새로운 걸 배우는 일은 배움뿐만이 아니라 무언가 실제로 일을 함으로써 시작되는 거라는 사실을 일깨워준 좋은 글입니다. 두고두고 읽고 싶어서 번역합니당 ‘ㅅ’….

어느 정도의 의역이 있는 것 같아요. 한국 사람에게 조금 더 이해가 갈 만한 형태로…?

원문: Click to read more ...

Implicit Negative Feedback In Bayesian Personalized Ranking

잡담

이거 진짜 내 일이랑은 하나도 상관 없는 것 아닐까? 이런 글 쓰는 동안에 딥러닝 공부를 조금 더 하는게 도움이 더 되는 것 아닐까? 생각했지만… 역시 관심도 없는 거 하는 것보다는, 별로 도움이 안 되더라도 관심가는 걸 공부해야겠지 하는 생각이 들었다. Negative Feedback의 활용에 대해서는, 예전부터 관심이 많았으니까.

그리고, interaction matrix의 Sparsity를 고려한다면, 점점 더 다양한 종류의 데이터를 활용하는 것이 중요해질 것 같다고 생각한다.

그렇게 생각하는 이유는 다음과 같다.

항상 CNN/RNN 모델을 돌릴 수는 없고, 여전히 CF 모델의 성능이 content based method보다 성능이 좋다.
user와 item의 interaction의 종류가 같은 서비스 내에서 증가하고 있다. ...