8월 1일의 일기

RecSys 2022 Challenge 참가 후기.

딱히 방법론에 대한 얘기를 자세히 할건 아니고 그냥 드는 생각에 관한 얘기.

올해 참가한 RecSys Challenge는 50등에 가까운 점수로, 그렇게 좋은 성적이라고 말하기는 힘든 점수다. 리더보드에서는 13등이었는데 최종 제출할 때 실수가 있었다. 등수 자체는 8등이었던 작년이 훨씬 나았지만, 번엔 논문을 써서 마무리를 지었다는 점을 잘 한 것 같다. 회사에서 실험할 수 있는 형태로 산출물을 만든 것도 좀 잘 한 것 같다.

가끔 머리가 나빠졌다는 생각을 많이 한다. 서버 프로그래밍을 공부하던 시절에는, epoll같은 비동기 프로그래밍을 눈 감고도 할 수 있었다. (사실 진짜 눈 감고는 못 할 것 같다.) 뭔가 열심히 공부하던 시절엔, 적분을 쪼금 더 잘 했던 것 ...

Click to read more ...

5월 26일의 일기

게으르다는 착각을 읽고

실제로 그렇게 성실히 살아온 것은 아니지만, 성실해야 한다는 압박감은 많이 느끼고 있었던 것 같다. 그런 압박감을 받아도 성실했던 적은 삶에서 많지 않았고, 죄책감을 느꼈던 적이 훨씬 많았다. 예를 들면 게임을 할 때 책상 위에 책이 놓여져 있으면 게임을 하면서도 죄책감이 들었다. 그렇지만 게임을 관둔 것은 아니었다. 죄책감을 느끼면서 게임을 했을 뿐이다.

죄책감을 느껴서 8시간 할 게임을 6시간만 했을지도 모르겠다. 그나마 이런 죄책감과 압박감을 받아왔기에 약간의 성실성을 발휘해 공부를 했던 것일까? 과거로 돌아가 다른 trajectory를 그려볼 수 없고, 현재에도 여러 trajectory를 다시 그려 볼 수 없기 때문에 알 수 없을 것 같다.

다른 것도 의심스러워진다. 애플워치나 핏빗같은 걸로 몸무게, 걸음 수를 트래킹하면 더 많이 걷고, 체중이 감소한다는 연구결과...

Click to read more ...

Embedding sets of vectors with EMDE

Translation of the post Embedding Sets of Vectors With EMDE

피쳐 엔지니어링으로서의 Vector Aggregation

EMDE는 인풋과 아웃풋만을 생각한다면, 벡터을 하나의 고정된 길이의 벡터로 변환하는 연산이다. 여러 벡터를 하나의 단일 벡터로 표현하는 연산은 그다지 쓸모가 없을 것 같지만 실제로는 상당히 흔한 연산이다. 특히 추천 시스템에서, 한 유저의 표현을 유저가 소비한 아이템의 목록으로 표현하기로 했을 때…

모든 음식들에 대한 좋은 임...

Click to read more ...

Well-Classified Examples are Underestimated...

Summary of the paper “Well-Classified Examples are Underestimated in Classification with Deep Neural Networks” of AAAI 2022

TL;DR;

  • I didn’t understand Energy related parts.

https://arxiv.org/abs/2110.06537

different losses/derivations w.r.t $p$ or $\theta$

where $p = \sigma(f(x))$ and $\sigma$ is sigmoid, and $f(x) \in \mathbb{R}^n$ is the o...

Click to read more ...

2월 11일의 일기

잡생각 1

여성운동을 볼 때마다 내가 가장 신기하게 느끼는 점은, 여성끼리 그렇게 동질감을 느낄 여지가 있냐는 점이다. 나는 다른 남성들에게 그다지 동질감을 잘 느끼지 못한다. 나는 나와 사회적 계층이 다른 남성들에게 그다지 동질감을 느끼지 못 한다. 이건 여성도 마찬가지일 것 같다. 내 생각에 나는 공대에서 컴퓨터공학을 전공한 뒤 프로그래머로 일 하고 있는 여성과 닮았을 것 같다. 돈 많은 남자보단 가난한 여자가 나랑 더 가까운 것 같다. 국적도 마찬가지인 것 같다. 러시아에 사는 하츠네미쿠 음악을 자주 듣는 안톤(43세, 프로그래머) 씨가, 내 옆 집 사는 나랑 동갑인 김창우(가상인물)씨보다 높은 확률로 나랑 더 닮아 있다고 생각한다.

국적이나 성별은 동질성을 나타내기에 너무 포괄적인 것 같다. 성별이나, 국적이나 그런 그룹이 그룹 내의 인원들에게 동질감을 주지 못하는 것임에도 불구하고 그룹의 존재감을 드러내려는 활...

Click to read more ...

Reverse Maximum Inner Product Search

Summary of the paper “Reverse Maximum Inner Product Search: How to efficiently find users who would like to buy my item?” of Recsys 2021

TL;DL;

I modified proofs and procedures for more clear self-understanding.

https://arxiv.org/abs/2110.07131

Notations

  • $u_i$ in $Q$ (User vectors)
  • $p_j$ in $P$ (Item vectors)
  • $<a, b>$: dot product between $a$ and $b$.<...
Click to read more ...