주요 메뉴 바로가기 보조 메뉴 바로가기 본문 바로가기

콘텐츠 본문

논문 국내 국내전문학술지(KCI급) StyleGAN을 활용한 다각도 2D 이미지 생성 기반의 3D 얼굴 특징점 추출 개선

  • 학술지 구분 국내전문학술지(KCI급)
  • 게재년월 2024-12
  • 저자명 이희열, 이승호
  • 학술지명 한국전기전자학회 논문지
  • 발행처명 한국전기전자학회
  • 발행국가 국내
  • 논문언어 한국어
  • 전체저자수 2
  • 연구분야 공학 > 전자/정보통신공학

논문 초록 (Abstract)

본 논문은 StyleGAN Encoder를 활용하여 단일 2D 이미지로부터 다각도의 얼굴 이미지를 생성하고, 이를 기존 3D 얼굴 특징점 추출 네트워크의 입력 구조에 통합하여 3D 모델의 정확성을 향상시키는 새로운 방법을 제안한다. 기존의 단일 이미지 기반 접근법은 입력 데이터의 제한으로 인해 각도에 따른 왜곡이나 정보 손실이 발생하는 한계가 있다. 이를 해결하기 위해, 본 연구에서는 StyleGAN Encoder를 활용해 생성된 다각도의 이미지를 입력으로 사용함으로써 3D 얼굴 모델링의 정밀도와 안정성을 동시에 개선하였다. 제안된 방법은 다각도의 정보를 제공하는 생성 이미지를 기존 3D 얼굴 특징점 추출 네트워크의 입력 구조에 통합하는 
방식으로 구현되었다. 이렇게 생성된 다각도 이미지는 각기 다른 시점에서 얼굴의 구조적 특성을 포착할 수 있어 기존의 단일 이미지 입력보다 더욱 풍부한 정보를 제공한다. 또한, 입력 구조의 개선을 통해 다각도 데이터를 입력하여 3D 얼굴 특징점을 더욱 정교하게 생성한다. 실험은 NoW 데이터셋을 활용하여 진행되었으며, 생성된 3D 얼굴 모델과 Ground Truth 3D 모델 간의 mesh 거리를 비교하였다. 실험 결과, PRNet은 평균 1.99, 표준편차 1.90, 3DDFA 모델은 평균 1.87, 표준편차 1.82에 비해, 제안된 방법은 평균 1.71, 표준편차 1.65로 측정되었다. 이는 제안된 방법이 기존 접근법에 비해 3D 얼굴 모델링의 정밀성과 안정성을 개선하
였음을 보여준다. 또한, 표준편차의 감소는 더욱 안정적으로 3D 얼굴 모델을 생성하여 성능 향상을 확인하였다.