Deep Learning

Paper Review: Speech2Face: Learning the Face behind a Voice(IEEE 2019)

해시브라우니 2024. 1. 29. 05:02

Speech2Face에 대해 논문을 읽고 제가 이해한대로 정리하여 PPT로 만들어보았습니다. 이번 논문 또한 Multi-modal에 관한 논문인데 실험결과에 대한 얘기가 많고 Training이나 내부 pipeline에 대한 설명은 간단한 것 같았습니다. Transformer구조가 안들어가서 그런 것 같기도하고요. 목소리를 통해서 얼굴을 복원한다는것이 평소에 우리가 어떤 사람 목소리를 듣고 해당 사람의 얼굴을 떠올린다는 점에서 매커니즘이 비슷한거 같아 정말 '지능' 같다는 생각이 들었습니다.