Developing a Hybrid Opinion Mining Model on Multilingual Social Media Text
- Abstract
- 인터넷과 스마트폰으로 대변되는 정보통신 기술의 발달로 말미암아 고객은 소셜 네트워킹 서비스에 쉽게 접근하고, 다양한 방식으로 상호간에 커뮤니케이션 하는 것이 가능해졌다. 또한, 소셜 네트워크의 사용자는 거리와 시간 그리고 공간의 확장으로 한 국가로 한정되는 것이 아니라 글로벌하게 구성됨으로써, 게시되는 많은 수의 의견들 또는 제품이나 서비스에 대한 피드백 등은 자국어뿐만 아니라 영어 등 다양한 언어로 구성되고 있다. 다양한 언어로 구성된 이러한 텍스트 정보들은 텍스트 마이닝과 오피니언 마이닝 기술의 발전 덕분에 제품이나 서비스에 대한 고객의 평가뿐만 아니라 기업의 전략을 구성하는 중요한 정보로 다루어지고 있다. 따라서 한가지 언어의 마이닝이 가진 분석의 한계를 뛰어 넘기 위해서는 다중언어로 구성된 이러한 고객들의 정보를 동시에 분석할 수 있는 기법이 필요한 상황이다.
이러한 배경에서 본 연구는 다중언어 소셜 미디어 텍스트 데이터의 분석에 관한 오피니언 마이닝의 새로운 모델을 제안한다. 즉, 다중 언어로 구성된 소셜 네트워킹 사이트 및 호텔 예약 포털 사이트에서 수집한 자료를 바탕으로 사전(dictionary) 기반과 기계 학습 방법, 그리고 인공지능을 이용한 오피니언 마이닝 모델의 특징과 예측 성능을 검토 한 후 이 방법들을 결합한 하이브리드 모델을 제안하였다. 또한, 소셜 미디어 텍스트 데이터는 비표준 언어를 통해 감정을 전달하는 경우가 빈번하게 발생하므로 비표준 언어로 구성된 텍스트 메시지를 처리하기 위한 사전(dictionary) 분석 모델도 개발하여 이 하이브리드 모델과 통합하였다.
이 새롭게 제안한 하이브리드 모델을 이용하여 분석해 본 결과 다중언어의 처리에 상당한 장점이 있음을 발견하였으며 특히, 비표준 언어를 표준언어와 동시에 처리함으로써 기존의 모델에서 분석하지 못하는 고객의 감성도 분석할 수 있음을 발견하였다. 따라서 이런 분석결과에 기초하여 향후 텍스트 기반의 오피니언 마이닝 분야에 본 연구가 제시하는 다중 언어 오피니언 마이닝 기법이 활용되어 더욱 풍부한 고객의 의견에 대한 분석결과가 기업의 운영과 전략에 응용될 수 있기를 기대한다.
- Author(s)
- LE, HOANHSU
- Issued Date
- 2016
- Awarded Date
- 2016. 8
- Type
- Dissertation
- Keyword
- Opinion Mining Multilingual Text
- Publisher
- 부경대학교 대학원
- URI
- https://repository.pknu.ac.kr:8443/handle/2021.oak/13225
http://pknu.dcollection.net/jsp/common/DcLoOrgPer.jsp?sItemId=000002300897
- Alternative Author(s)
- 레환수
- Affiliation
- 부경대학교 대학원
- Department
- 대학원 경영학과
- Advisor
- 이현규
- Table Of Contents
- CHAPTER 1. INTRODUCTION 1
1.1. Background 1
1.2. Research purposes 6
1.3. Research scopes 7
1.4. Dissertation structure 8
CHAPTER 2. LITERATURE REVIEW 11
2.1. Overview 11
2.2. Text mining and opinion analysis 11
2.2.1. Text mining and data mining 11
2.2.2. Opinion mining 13
2.3. Opinion mining techniques 14
2.3.1. Opinion mining levels 14
2.3.2. Opinion mining techniques 15
2.4. Multilingual text mining 25
2.5. English-Vietnamese bilingual text characteristics 28
CHAPTER 3. RESEARCH METHOD 32
3.1. Overview 32
3.2. Data collection 32
3.3. Data preprocessing 33
3.4. Features selection and extraction 43
3.5. Lexicon-based opinion mining model 47
3.6. Machine learning opinion model 49
3.7. Hybrid opinion model 52
3.8. Model performance matrix 54
3.8.1. Confusion matrix and accuracy 54
3.8.2. Precision and recall 56
3.8.3. ROC curves 57
CHAPTER 4. EXPERIMENTS AND RESULTS (1) 58
4.1. Overview 58
4.2. Data Collection 59
4.3. Experiment design 60
4.4. Experiment results 68
4.4.1. Lexicon-based opinion mining results 68
4.4.2. Machine learning based opinion mining results 70
4.4.3. Hybrid of lexicon-based and machine learning model results 75
4.5. Discussions 79
CHAPTER 5. EXPERIMENTS AND RESULTS (2) 81
5.1. Overview 81
5.2. Data Collection 84
5.3. Experiment design 87
5.4. Experiment results 92
5.4.1. Lexicon-based opinion mining results 92
5.4.2. Machine learning based opinion mining result 95
5.4.3. Hybrid of lexicon-based and machine learning opinion mining model results 104
5.5. Business application of opinion mining in hotel services industry 112
5.6. Discussions 121
CHAPTER 6. CONCLUSIONS 122
6.1. Summary 122
6.2. Research contributions and applications 123
6.3. Limitations and future research directions 125
REFERENCES 130
RELATED PUBLICATIONS 143
- Degree
- Doctor
-
Appears in Collections:
- 경영대학원 > 경영학과
- Authorize & License
-
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.