[Boostcamp, AI Tech] 4주차 회고

Summary 🤙

P stage가 시작되었다. Image Classification을 주제로 EDA 부터 Model, Train 까지 딥러닝 프로젝트의 전체적인 플로우를 직접 구현해보면서 전체적인 그림을 그릴 수 있는 주였다.

Keywords 👀

Tasks 🤷

Topic of Peer Session 🧑‍🏫

Imbalanced Data를 다루는 방법 : Data Augmentation, Weight, SMOTE …
백그라운드에서 학습 시키기 : tmux, nohup
Mislabeling에 대처하는 현실적인 방법

Retrospective 👍

이번주는 지금까지의 부캠 과정 중 가장 재미있는 시간이었다. 토막나있던 어렴풋한 지식들이 조각으로 맞춰지고 비로소 전체적인 프로세스가 어떻게 진행되는지 이해할 수 있었다.
무엇을 해야하는지 명확해지면서, 재사용 가능한 코드와, 실험의 다양한 인자들을 쉽게 조절할 수 있는 구조를 짜기 위해 스스로 IDLE 구조를 구상해보았다.
1. 머신러닝 프로세스에서 각 스텝별로 모듈화하여 기본적인 추상화 모델을 정의하고 구현체를 주입하는 방식으로 코드를 구현하려고 노력했다. (Spring 에서 추상화 모듈을 구현하여 Bean으로 만드는 것처럼…)
2. 중간에 로그를 찍는 행위나 한 epoch을 돌았을 때 하고자 하는 행위 등, 나만의 Hook을 적절한 지점에 만들어 외부에서 주입되도록 했다.
3. 이 밖에도 tensorboard나 wandb 같은 모니터링을 위한 코드도 최대한 외부에서 주입하는 방향으로 구상할 예정이다.
사실 이번 스테이지의 나만의 목표는 다음과 같다.
1. 리더보드의 등수는 큰 관심사가 아니다. (우리 팀원들이 너무 잘해서 현재 1등이라 할수 있는 생각인가…)
2. 첫번째 원하는 것은 실험실을 쾌적하게 만드는 것이다. 흔히, 웹 개발을 하다보면 “개발자가 비즈니스 로직에만 집중할 수 있도록….” 이라는 이유에서 시작하는 것들이 꽤 많다. 따라서 추후에 “학습 성능에만 집중할 수 있도록…” 하기 위해 나만의 실험실을 잘 꾸리는 것을 첫번째 목표로 잡았다.
3. 실험실이 잘 만들어지면, 그때 논문이나, 테크닉을 다양하게 참고하여 성능을 올리는 것에 집중할 예정이다.
마무리는, 점점 딥러닝을 둘러싼 엔지니어링 분야에서 내가 무엇을 좋아하고 뭘 해야하는지 점점 알것 같아서 너무나 흥미진진하다. (개인 등수는… 마음이 좀 아프긴하다…)

[Boostcamp, AI Tech] 4주차 회고

Categories

Tags

Summary 🤙

Keywords 👀

Tasks 🤷

Topic of Peer Session 🧑‍🏫

Retrospective 👍