주요 메뉴 바로가기 보조 메뉴 바로가기 본문 바로가기

콘텐츠 본문

새글 논문 국내 국내전문학술지(KCI급) 교차 어텐션 기반의 영어 다중 표현 융합을 이용한 한국어 의미 모호성 완화 및 분류 성능 향상

  • 학술지 구분 국내전문학술지(KCI급)
  • 게재년월 2026-04
  • 저자명 이태윤, 이승호
  • 학술지명 대한전자공학회 논문지
  • 발행처명 대한전자공학회
  • 발행국가 국내
  • 논문언어 한국어
  • 전체저자수 2
  • 연구분야 공학 > 전자/정보통신공학

논문 초록 (Abstract)

본 논문은 교차 어텐션 기반의 영어 다중 표현 융합을 이용한 한국어 의미 모호성 완화 및 분류 성능 향상 방법을 제안한다. 한국어는 복잡한 어미 활용과 구조적 모호성으로 인해 최신 NLP 기술의 발전에도 불구하고 영어 모델 대비 성능 격차가 여전히 존재한다. 이를 해결하기 위해 제안하는 모델은 기계 번역된 병렬 코퍼스를 입력으로 사용하며, 단순 임베딩을 넘어 자모(Jamo) 및 문자 단위 N-gram TF-IDF를 보조 특징으로 추출해 미세한 형태소 정보를 보강하였다. 이렇게 추출된 이종 언어 특징들은 교차 어텐션(Cross-Attention)을 통해 융합되는데, 이 과정에서 명확한 문장 성분을 가진 영어의 특성을 단서로 활용하여 한국어의 의미적 불확실성을 상호 보완한다. 또한, 교차 엔트로피 손실에 지도형 대조 학습(Supervised Contrastive Loss)을 결합하여 입력 문장 형태 변화에도 강건한 모델을 구축하였다. K-MHaS 데이터셋 실험 결과, 제안 모델은 F1-weighted 0.9317, 정확도 0.9212를 기록하며 기존 단일 언어 모델 대비 유의미한 성능 향상을 입증하였다.