주요 메뉴 바로가기 보조 메뉴 바로가기 본문 바로가기

콘텐츠 본문

논문 국내 국내전문학술지(KCI급) 스팸 메일 분류를 위한 데이터 마이닝 응용

  • 학술지 구분 국내전문학술지(KCI급)
  • 게재년월 2016-07
  • 저자명 김기태
  • 학술지명 예술인문사회 융합 멀티미디어 논문지
  • 발행처명 사단법인 인문사회과학기술융합학회
  • 발행국가 국내
  • 논문언어 한국어
  • 전체저자수 1

논문 초록 (Abstract)

본 연구는 데이터 마이닝을 이용하여 스팸메일을 분류하는 문제에 대한 해법을 제시한다. 인터넷의 보급과 전산화로 인해 이메일을 이용하는 개인이나 단체가 증가하면서 생활의 편리함과 비즈니스에서의 효율성 이 크게 향상이 되었다. 반면에 이러한 변화는 스팸메일을 수신하면서 많은 문제들을 야기시키고 있다. 스팸메일은 광고나 악의적인 목적으로 원하지 않 는 수신자에게 전달되는 이메일을 말한다. 스팸메일은 개인에게는 혼 란과 컴퓨터에 악영향을 미치고, 비즈니스에서는 중요한 업무를 방해하 는 등 악영향을◐“�있다. 이러한 스팸메일을 스팸메일함으로 보내는 방법이 많이 연구되어 왔지만 효과적인 방법에 대한 필요가 여전히 높다. 이러한 문제를 해결하기 위해서 많은 해결 방법론이 연구되어져 왔고 데 이터 마이닝이 우수한 결과를 보여줬다. 하지만 보유하고 있�데이터 의 상태가 불완전한 경우에는 데이터 마이닝 기법을 적용하기 쉽지 않다. 특히 데이터의 클레스에 대한 정보가 한쪽만 가지고 있거나 불확실 한 경우에 대해서는 일반적인 데이터 마이닝 기법은 분류모형을 찾는 것 이 어렵다. 본 논문에서는 이를 해결하기 위해 PU learning을 이용한다. 또 한 기본 데이터 마이닝 기법으로는 Support Vector Machine(SVM)을 적용하였 다. 실험 결과에서는 제시한 방법론이 스팸메일 분류에 대해 좋은 분 류모형을 제시할 수 있다는 것을 보여준다.