주요 메뉴 바로가기 보조 메뉴 바로가기 본문 바로가기

콘텐츠 본문

새글 논문 국내 국내전문학술지(KCI급) 단일 사람 3D 키포인트 검출을 위한 Cross Attention 트랜스포머 모델 설계 및 성능 분석

  • 학술지 구분 국내전문학술지(KCI급)
  • 게재년월 2026-04
  • 저자명 신인영, 이승호
  • 학술지명 대한전자공학회 논문지
  • 발행처명 대한전자공학회
  • 발행국가 국내
  • 논문언어 한국어
  • 전체저자수 2
  • 연구분야 공학 > 전자/정보통신공학

논문 초록 (Abstract)

본 논문에서는 단일 인물 3D 자세 추정의 정확도와 연산 효율성을 동시에 극대화하기 위해, Cross-Attention 메커니즘 기반의 새로운 시공간 통합 트랜스포머(Spatio-Temporal Feature Fusion Transformer) 모델을 제안한다. 기존의 2D 키포인트 기반 접근법은 입력 데이터의 노이즈와 떨림 현상으로 인해 3D 복원 시 불안정한 결과를 초래하는 한계가 있었다. 이를 해결하기 위해 본 연구는 이산 코사인 변환(DCT)을 전처리 단계에 도입하여 시계열 데이터의 불필요한 고주파 성분을 필터링함으로써, 노이즈를 효과적으로 억제하고 동작의 시간적 연속성을 확보하였다. 또한 공간 트랜스포머를 통해 인체 관절 간의 기하학적 관계를 벡터화하고, 이를 시간적 특징과 결합하기 위해 Cross-Attention 구조를 적용하였다. 이 융합 모델은 공간적 구조 정보와 시간적 동적 정보를 상호 보완적으로 학습하여 추정의 정밀도를 높인다. 결과적으로 본 연구는 주파수 영역의 전처리와 시공간 통합 어텐션 기법의 시너지를 통해, 단일 인물 3D 자세 추정에서 모델의 강건성과 추정 성능이 유의미하게 향상됨을 입증하고자 한다.