Deep Learning 27

Paper Review: Spectral Normalization for GANs

이번에 논문을 정리한 것은 Spectral Normalization에 관한 논문입니다. 해당 논문은 수학적 지식, 특히 선형대수 파트가 많이 사용된 것 같고, 선형대수쪽에 아무래도 매번.. (학부수업때도 잘 못 습득함) 어려움을 겪다 보니 기본적인 rank나, Singular value가 어떤 의미를 갖는지 이해하는데 어려웠던 것 같네요. 논문을 읽고 나서도 확실하게 두 개념에 대해서는 정리가 되는 느낌은 아닙니다. 아무래도 선형대수를 한번 더.. 꼼꼼하게 봐야할 것 같고, 최대한 이해한대로 정리해서 업로드하니 틀린정보가 있을 수도 있다는 점 혹시나 검색을 통하여 읽고 계시다면 양해 부탁드립니다. 그리고 수식이 많이 깨지네요. 노션으로 할땐 괜찮았는데 .. SNGAN Spectral Normalizati..

Deep Learning 2024.03.16

PyTorch Full Tutorial Course by 이수안컴퓨터연구소

이번에 PyTorch관련 코드를 보는 중 파편화된 지식이 많은 것 같아서 시간을 내서 PyTorch에 대해 한번 싹 정리해보자고 마음 먹었었습니다. 유튜브에서 안그래도 예전에 정리할때 보려고 추가했던 아래 링크: https://youtu.be/k60oT_8lyFw?feature=shared 를 보고 기존에 애매하게 알던 것들을 정리했구요. 정확하게 함수에 대한 인자나, 아주 세세하지는 않지만, 저 처럼 좀 파이토치에 대해 듬성듬성 알고 계시는 분들에게 좋은 것 같습니다. PyTorch 페이스북이 루아 언어로 개발된 Torch를 파이썬 버전으로 개발 초기에 Torch는 넘파이 라이브러리처럼 과학 연산을 위한 라이브러리로 공개 이후 GPU를 이용한 텐서 조작 및 동적 신경망 구축이 가능하도록 딥러닝 프레임워..

Deep Learning 2024.03.08

Paper Review: Large Scale GAN Training for High Fidelity Natural Image Synthesis

오늘의 포스팅은 BigGAN에 대한 리뷰입니다. BigGAN은 GAN보다 큰 구조를 채택해서 더 좋은 결과를 나타내도록 하게 한 모델입니다. 논문에서 나온 방법들이 정확하게 하나하나 무엇인지 이해하는 것이 꽤 어려웠던 논문인거같습니다. 여러가지 짬뽕같은 느낌이라 그런지.. 특히 선형대수의 Background가 탄탄해야 좋을 것 같다는 생각과 ,, 특히 특이값에 대한 이해가 있으면 좋을 것 같습니다. 최대한 제가 이해한 만큼 정리를 하였으니.. 만약 검색에 의해서 보시게 되신다면 틀린 정보가 있어도 다른 분들의 정보와 비교해서 보시면 좋을 것 같습니다. BigGAN Large Scale GAN Training for High Fidelity Natural Image Synthesis Introduction..

Deep Learning 2024.03.04

Paper Review: Self-Attention Generative Adversarial Networks

이번에 읽은 논문은 기본적인 GAN에 대한 논문으로 Self-Attention module을 적용한 GAN에 대한 논문입니다.. Transformer에서 사용되는 Self attention과 유사하게 적용되는 것 같습니다. 역시 마찬가지로 이해한대로 정리한 것이고 틀린 정보가 있을 수 있습니다. Self-Attention Generative Adversarial Nets Abstract 해당 논문은 Self-Attention GAN을 제안함 Convolutional GAN은 높은 해상도의 디테일들을 저해상도의 feature map으로 생성하는 반면, Self-Attention GAN은 모든 feature location에서 얻은 힌트를 사용해 디테일을 생성함 더 나아가서 Discriminator는 먼 부..

Deep Learning 2024.02.27

Paper Review: Conditional Generative Adversarial Nets & Instance Conditioned GAN

이번 논문은 GAN에 추가적인 옵션?이 달린 GAN에 대한 논문입니다. 상위 Multi-modal 논문을 읽다보니 Conditional GAN이나, Instance condtioned GAN에 대한 지식이 필요하더라구요.. 그래서 새로운 지식을 습득해보고자 읽어봤습니다! GAN에 대해 좀 알고..? 확률적인 부분, 분포에 대해서 머릿속으로 이미지 메이킹을 해보면 어떻게 작동하는지 조금은 어림잡을 수 있습니다. 마찬가지로 제가 이해한대로 정리하고 틀린 부분이 존재할 수 있습니다. Conditional Generative Adversarial Nets Abstract 조건부 버전의 GAN 새로운 데이터 y를 사용하여 Generator 와 Discriminator에 조건을 부여하려함 멀티 모달에서 어떻게 사용..

Deep Learning 2024.02.24

Paper Review: Novel Class Discovery : an Introduction and Key concepts & Joint Representation Learning and Novel Category Discovery on Single- and Multi-modal Data 2

이어서 정리한 joint representation에 대한 논문 정리입니다. Abstract 해당 논문은 싱글 그리고 멀티모달의 다르지만 관련있는 카테고리의 라벨 데이터에 대한 문제를 다룸 Jointly learn, Unlabel 데이터에 대한 클러스터를 적용하기 위한 End-to-end 프레임워크를 구현 자기지도학습을 사용하여 오버피팅을 방지 특히, 클래스분류나 크로스-모달 분류를 사용 WTA라는 해싱 알고리즘을 사용하여 수도라벨을 생성하였음 Introduction 실생활에 딥러닝을 적용하는 것은 많은 문제들을 동반하는데, 이는 클래스 정의하는데 많은 비용이 발생한다는 점과, 새로운 클래스들도 나타나고 있다는 점 반대로 생각하면, 실제 세계는 풍부한 멀티모달의 Unlabel 데이터를 생산한다. 이 데이..

Deep Learning 2024.02.19

Paper Review: Novel Class Discovery : an Introduction and Key concepts & Joint Representation Learning and Novel Category Discovery on Single- and Multi-modal Data 1

Multi-modal 관련 논문을 읽고, joint represenation에 대한 정보가 없는 것 같아 찾아서 읽어보게 되었습니다. Joint representation을 진행하는 하나의 기법이긴 하다만, 어떻게 joint representation이 되는지 확인은 한 것 같아서 논문을 이어서 보기 조금은 수월해지지 않았을까 생각합니다. 읽던 도중에 Novel Class(Category) Discovery에 대한 부분도 생소한 것 같아서 정의를 찾아보기 위해 또 다른 논문을 건드리게 되었구요.. 그 부분은 알고 싶은 부분만 따서 정리하였고 1,2 로 나누어서 두 논문을 정리했습니다. 제가 이해한대로 업로드하고,, 틀린 부분이 분명 존재할 수 있습니다. 논문의 난이도도 어렵네요 ;; Novel Class..

Deep Learning 2024.02.19

Yolo V5 Training with CrowdHuman Dataset

벌써 Yolo에 관한 5번째 포스팅이네요. 이번엔 저희 프로젝트 주제인 가려짐에 강인한 Yolo를 구현하기 위해 가려진 물체가 존재하는 Dataset을 찾아서 적용하였습니다. 적용할 Dataset은 CrowdHuman Dataset이고, 아래 링크를 참고 해주세요 https://www.crowdhuman.org/ CrowdHuman Dataset Volume, density and diversity of different human detection datasets. For fair comparison, we only show the statistics of training subset. Comparison of the visible ratio between our CrowdHuman and CityPe..

Deep Learning 2024.02.14

Paper Review: A Simple Framework for Contrastive Learning of Visual Representations

SimCLR에 대해 논문을 읽고 제가 이해한대로 정리하여 PPT로 만들어보았습니다. 이번 논문은 Multimodal논문이나 Augmentation부분에서도 사용되는 것 같고, 궁금한 부분을 찾아보다가 Self-supervised learning에 대해 더 알아가보고 싶은 관심으로 읽게 되었습니다. Self로 learning한다는게 쉽지 않은 것 같은데 정말 이런 생각을 어떻게 했는지,, 아직도 완벽하게 숙지는 안된 것 같지만 새로운 SSL관련 논문을 읽어보고 싶다는 생각은 하게 되네요 . Data의 한계에서 어떻게 더 나아갈 수 있는지, 앞으로 나올 기법들이 궁금하군요.. 잘못된 부분이 존재할 수 있으며, 처음 부분은 Contrastive learning에 대해 좀 더 알아보고 작성하였습니다.

Deep Learning 2024.02.10

Yolo V5 Gridmask Augmentation

Cutout augmentation에 이어서 Gridmask를 적용하는 것도 진행을 하였습니다. Cutout은 코드가 적용되어 있는데에 반해 Gridmask는 따로 없어서 Github에서 긁어서 진행하였구요. https://github.com/dvlab-research/GridMask GitHub - dvlab-research/GridMask Contribute to dvlab-research/GridMask development by creating an account on GitHub. github.com gridmask를 구현하는 python파일은 gridmask 파일 중 data/transform/grid.py에 구현되어 있습니다. 기존에 yolo에서 진행하는 Augmentation에서 datal..

Deep Learning 2024.02.07