이미지 분석을 들어가며, 어떤 것을 사용하는 것이 유리할 지에 대해서 조사를 진행했습니다.
진행하기 앞서, 먼저 GPT에게 한번 물어봤습니다.

역시, RGB와 GRAY 장, 단점이 모두 존재했습니다.
물론 실험적으로 어떤 방식을 택하는 것이 유리한지 결정하면 좋을 것 같지만, 그래도 분석을 한번 진행해 보고자 합니다.
우선 한 장의 이미지가 아닌 모든 Test DataSet 의 RGB 값을 평균내었고, RGB 값의 평균이 어떻게 분포되어 있는지, 또 Luminosity Gray-scale로 변경하는 경우 어떤 차이를 보여주는지에 대해 분석해보았습니다.
먼저, 각 Dataset에서 성별, 마스크 착용 여부, 나이의 분포를 알아보고자 했습니다.

성별 분포의 경우 제공되었던 baseline코드를 활용했고, 이미 어느 정도 분석이 완료 되었다고 생각해서 더 진행하지 않았습니다.

나이에 대해 분석이 완료되어 있었지만, 현재 나이 문제의 경우 30), [30, 60), [60 이 3가지에 대해 분류를 진행하기 때문에, 새롭게 분포를 확인했습니다.

제공되었던 나이 분포와는 달리, 30대 미만과 30이상 60미만이 충분히 존재하고, 60이상의 데이터가 부족한 것을 볼 수 있었습니다.
따라서, 추후 데이터 량을 늘리고자 할 때에는 60이상의 데이터를 먼저 늘려 비율을 어느 정도 맞춘 뒤, Augmentation을 진행하는 것이 유리하지 않을까 생각합니다.
마스크의 경우에는 1:5:1로 제공되고 있다고 나와있기 때문에, 따로 그래프를 작성하지는 않았습니다.
마스크 착용 여부에 대한 RGB와 Gray 분포 조사
먼저, 마스크 착용 여부에 따라 RGB의 분포를 확인했습니다.

보시는 것과 같이, 분명히 3개를 그렸는데 2개밖에 보이지 않습니다.
그 이유는 normal과 incorrect의 평균 RGB 값 분포가 거의 동일하게 나왔기 때문입니다.
RGB를 사용한다면, 마스크를 올바르게 착용했는지 / (미착용, 잘못된 착용)에 대해서는 차이가 있는 정보를 가지고 있다는 생각이 들었습니다.
이후, Gray-Scale로 변환하여 분포를 확인했습니다.

물론 RGB → Luminosity Gray-Scale은 특정 값을 곱해서 변경하는 것이기 때문에, 해당 경우에도 유사한 결과가 나왔습니다.
개인적인 결론:
마스크 착용/마스크 미착용/마스크 잘못 착용 이 세 가지를 구분하는 데 있어서 RGB, 혹은 Gray-Scale로 변경하는 것은 큰 영향을 주지 못할 것으로 생각합니다.
하지만 마스크 올바른 착용/그렇지 않음 두 가지로 나누는 데는 유의미한 영향이 있을 것으로 생각합니다.
나이에 대한 RGB와 Gray 분포 조사
이후, 각 나이에 따라 RGB의 분포를 확인했다.

마스크의 경우와는 달리, 모두 조금씩 다른 분포를 보여주고 있었습니다!
이후, Gray-Scale로 변환하여 분포를 확인했습니다.

RGB의 경우와 유사하게, 어느 정도 차이를 보여주고 있습니다.
개인적인 결론:
나이의 경우에는, 실험적으로 두 가지 경우를 해보며 더 좋은 모델을 선택하는 것이 유리하다고 생각됩니다. 두 가지 모두 유의미한 정보를 포함하고 있다고 생각합니다.
성별에 대한 RGB와 Gray 분포 조사
마지막으로, 성별에 따른 RGB의 분포를 확인했습니다.

이 역시 분포에서 차이를 보여주고 있습니다.
이후 Gray-Scale로 변환하여 확인한 결과는 다음과 같습니다.

성별의 경우, 나이와는 다르게 거의 유사한 분포를 띄고 있는 것을 볼 수 있었습니다.
개인적인 결론:
성별에서도 마찬가지로 RGB, Gray-Scale 두 가지 모두 실험해 보며 더 좋은 결과를 도출하는 모델을 선택하는 것이 유리할 것으로 생각됩니다.
마무리:
전체적인 결론은, Test Dataset에서는 전반적으로 RGB나 GRAY 모두 유의미한 정보를 가지고 있다는 생각이 들었습니다.
하지만 마스크 검출의 경우에는 이미지의 색상이 변하는데 있어 큰 영향이 있지는 않을 것 같다는 생각이 들었습니다.
혹시 제가 놓친 부분이 있다면, 자유롭게 말씀해 주시면 좋겠습니다!
감사합니다.
'네이버 부스트캠프 AI Tech' 카테고리의 다른 글
CutMix: Regularization Strategy to Train Strong Classifierswith Localizable Features (0) | 2023.12.20 |
---|---|
12.15 주간 회고록 (1) | 2023.12.15 |
CNN Visualization, grad_CAM 관련 끄적끄적 (0) | 2023.12.10 |
12.08 주간 회고록 (2) | 2023.12.08 |
끄적끄적 궁금증 (0) | 2023.12.08 |