본문 바로가기

전체 글

(52)
PET의 Encoder 개수에 대한 고찰 이전 포스팅과 같이 코드를 정리한 이후, Encoder 개수에 대해 의구심이 들어 다음과 같이 가설을 세웠습니다. 그 결과로 위와 같은 좋은 결과를 얻을 수 있었습니다.
PET (Point quEry Transformer) 코드 PET (Point quEry Transformer) 에서 핵심이 되는 backbone과 transformer 진행 방식에 대해 정리해봤습니다. pdf로 보기 용이하게 글씨를 줄였기 때문에, 뭉개져서 보기 힘든 부분이 있을 수 있습니다. 그런 경우에는 https://1drv.ms/o/s!AqaWCHp7NeOgg4ExylUk8xvo_O6ZJw?e=oyy8xQ 에서 원본으로 보시는 것을 추천합니다. 감사합니다. PET - Microsoft OneNote Online onedrive.live.com
12.29 주간 회고록 솔직히 이번주는 무슨 일을 했는지 잘 생각이 나지 않는다. 하지만 그래도 마지막으로 보내는 level1 피어세션을 그냥 보내지 않기 위해 이벤트를 하나 준비했다! 다들 재밌게 즐겨준 것 같아서, 너무 행복했다. 이별을 아쉬움이 아니, 또 다른 즐거움으로 기억해주었으면 하는 마음에 준비를 했다. 나름 다들 재밌게 즐겨준 것 같아, 다행이다. 이번주 강의는 전반적인 방식에 대해 들었고, 그 때문에 듣기 수월했다. 다음주면 level2 새로운 사람들과 새로운 시작을 하게 된다. 우리 06조원들이 level2에서도 힘내주길 바라며, 6조 화이팅!
[CLIP] Learning Transferable Visual Models From Natural Language Supervision CutMix로 날먹하기에 살짝 양심에 찔려, 다른 논문 한편을 추가로 준비하고자 한다. CLIP Contrastive Language-Image Pre-treaining 들어가기 앞서- zero-shot이란? 모델이 학습 과정에서 배우지 않은 작업을 수행하는 것. →General한 task 수행 [ 배경 ] 이미지에 대한 날것의 텍스트로 부터 학습하는 것은 어려운 일이다. → pre-training된 task로 이미지에 맞는 caption을 예측하고, pre-training이후 visual concept에 학습한다. NLP는 웹에 있는 수많은 사람들이 라벨링한 데이터셋이 존재한다. 하지만 Vision의 경우에는 web-scale이 아닌, ImageNet과 같이 대량으로 라벨링된 데이터가 표준이다. →이미..
12.22 주간 회고록 정말 오랜만에 코딩이 즐겁다는 생각이 들었다. 한가지의 목표를 서로 다른 6명이서 함께 해 나가는것이 이렇게 즐거운 일이라는 것을 다시 알게 되었다. 물론 내가 시도했던 시도들이 그닥 좋은 영향을 주지 못한것도 아쉽지만, 우리는 마지막의 마지막 까지 노력했다. 기 제출 결과가 14등이라 아쉬웠지만, 최종은 13등으로 한 등수 올랐다! 여러 고민들이 많았지만, 시도하지 못한것이 조금 아쉽다. 항상 무슨 일을 끝마치고 나면 아쉬움이 많이 드는것 같다. 이번 기회를 발판삼아 다음 기회를 더 잘 이용할 수 있도록 해야겠다.
CutMix: Regularization Strategy to Train Strong Classifierswith Localizable Features 한국인들이 만든, NAVER에서 연구를 진행한 CutMix에 대해서 알아보도록 하자. 마침 이번 프로젝트에서 CutMix를 제작하고, 사용해 보기까지 하며 해당 논문에 대해 리뷰를 진행하고자 한다. Github 코드가 있다는 것도 다 만들고 나서 알았다... CutMix의 아이디어는 Regional dropout 전략에서부터 파생되었다. Regional dropout 전략의 경우에는, 모델이 특정 부분에만 집중되게 하지 않도록 입력을 조정하는 방법이다. (예: 사람 판별에 있어 다리보다는 얼굴만 보는 경우가 있기 때문) 이전에는 Mixup, Cutout 방식이 있었지만, CutMix라는 새로운 방법을 제시한다. 흔히들 자주 본 사진이다. Mixup의 경우에는 특정 퍼센테이지 만큼 두 사진을 그저 동일하게..
12.15 주간 회고록 첫 프로젝트가 시작됐다! 우선, 프로젝트에 집중하고 싶어서 첫 2일 이내로 모든 강의를 다 들었다. 그 이후, 코드 분석 및 EDA 분석을 진행했다. https://rnltls.tistory.com/40 RGB, GRAY에 관한 고찰 이미지 분석을 들어가며, 어떤 것을 사용하는 것이 유리할 지에 대해서 조사를 진행했습니다. 진행하기 앞서, 먼저 GPT에게 한번 물어봤습니다. 역시, RGB와 GRAY 장, 단점이 모두 존재했습니다. 물 rnltls.tistory.com 나름 열심히 분석 했는데, 조금 아쉬운 분석이 아니었지 않은가 싶다. 또, CutMix를 완성해서 조금 뿌듯하다. 하지만 Loss를 새로 구축해야한다는 점이 있어서, 조금 귀찮은 일이 계속되지 않을까 생각한다. 아무쪼록 이번주는 굉장히 바쁜..
RGB, GRAY에 관한 고찰 이미지 분석을 들어가며, 어떤 것을 사용하는 것이 유리할 지에 대해서 조사를 진행했습니다. 진행하기 앞서, 먼저 GPT에게 한번 물어봤습니다. 역시, RGB와 GRAY 장, 단점이 모두 존재했습니다. 물론 실험적으로 어떤 방식을 택하는 것이 유리한지 결정하면 좋을 것 같지만, 그래도 분석을 한번 진행해 보고자 합니다. 우선 한 장의 이미지가 아닌 모든 Test DataSet 의 RGB 값을 평균내었고, RGB 값의 평균이 어떻게 분포되어 있는지, 또 Luminosity Gray-scale로 변경하는 경우 어떤 차이를 보여주는지에 대해 분석해보았습니다. 먼저, 각 Dataset에서 성별, 마스크 착용 여부, 나이의 분포를 알아보고자 했습니다. 성별 분포의 경우 제공되었던 baseline코드를 활용했고, 이..