문서 분류 시스템

본 문서 분류기는 kNN(k Nearest Neighboring) 학습 방법을 이용한 문서 분류기의 데모시스템입니다.

인터넷 문서 5,000여개에서 추출한 자질 중 실험적으로 가장 높은 성능을 보인 20,00개의 자질을 추출하여 정보 검색 기법에서 사용되는 TF/IDF 기법을 이용하여 자질의 Weight값을 만들었고, Nearest Neighbor을 추출하기 위하여 Cosine Measure를 사용하고 있습니다.

아래의 창에 분류하고자 하는 문서를 입력하고 분류하기 버튼을 누르시면 해당 문서의 분류 결과가 순위 별로 나타납니다. (5순위까지 출력됩니다.)     [분류표보기]