논문 (학술지)
Word2vec과 앙상블 분류기를 사용한 효율적 한국어 감성 분류 방안
등록번호 | RPMS-2019-0090752971 | SCI 구분
?
※구분 : SCI(SCIE포함), 비SCI |
비SCI |
---|---|---|---|
저자명 (주·공동저자) | 박성수; 이건창 ※ 과제 참여정보와 일치하는 연구자 상세정보로 정확하지 않을 수 있습니다. |
||
논문구분 | 국내전문학술지 | 학술지명 | 디지털콘텐츠학회논문지 |
ISSN | 1598-2009 | 학술지 출판일자 | 2018-01-01 |
학술지 볼륨번호 | 19 | 논문페이지 | 133 ~ 140 |
학술지 임팩트팩터 | 0.0 | 기여율 | 100 % |
DOI | 10.9728/dcs.2018.19.1.133 | ||
키워드 |
앙상블 분류기, 자질 표현, 감성분류
Bag-of-words(BOW), Sentiment classification, ensemble classifier, feature representation, word2vec |
||
초록 | 감성 분석에서 정확한 감성 분류는 중요한 연구 주제이다. 본 연구는 최근 많은 연구가 이루어지는 word2vec과 앙상블 방법을 이용하여 효과적으로 한국어 리뷰를 감성 분류하는 방법을 제시한다. 연구는 20 만 개의 한국 영화 리뷰 텍스트에 대해, 품사 기반 BOW 자질과 word2vec를 사용한 자질을 생성하고, 두 개의 자질 표현을 결합한 통합 자질을 생성했다. 감성 분류를 위해 Logistic Regression, Decision Tree, Naive Bayes, Support Vector Machine의 단일 분류기와 Adaptive Boost, Bagging, Gradient Boosting, Random Forest의 앙상블 분류기를 사용하였다. 연구 결과로 형용사와 부사를 포함한 BOW자질과 word2vec자질로 구성된 통합 자질 표현이 가장 높은 감성 분류 정확도를 보였다. 실증결과, 단일 분류기인 SVM이 가장 높은 성능을 나타내었지만, 앙상블 분류기는 단일 분류기와 비슷하거나 약간 낮은 성능을 보였다. |
연구개발성과 등록 또는 활용에 대한 문의는 논문 연구개발성과 담당자를 통해 문의하시기 바랍니다.
[문의] 한국과학기술정보연구원 Tel : 042)716-7066, https://curation.kisti.re.kr/
- NTIS 관련 이용문의는 NTIS 콜센터(042-869-1115)로 문의하시기 바랍니다.
NTIS의 논문 정보는 국가연구개발사업 수행을 통해 발생된 성과로, 조사분석 등을 통해 입력된 정보를 수집 및 제공하고 있어, 출판사 또는 논문 정보 제공 사이트(Scienceon, RISS 등)에서 일괄 제공하는 논문 정보와 차이가 있을 수 있습니다.