PUKYONG

웹뉴스 텍스트 마이닝을 이용한 주가 등락 예측

Metadata Downloads
Abstract
In the Internet, a sheer number of newspaper articles about economy and finance are generated every day. This paper attempts to predict stock price fluctuation by making use of internet news appearance of companies through a text mining procedure.

Therefore, this paper presents a procedure to predict the future stock price fluctuations where N-gram is used to express words and Word2vec to label words. In contrast with only one time window of news information in other papers, a methodology using word trend data is proposed. SVM (Support Vector Machine) is used to predict the stock price fluctuation. The performance of the proposed procedure is evaluated by using historical news and finance data. The results show that the word trend based methodology gives a improvement while Word2Vec gives approximation to existing method.
Author(s)
최일지
Issued Date
2016
Awarded Date
2016. 2
Type
Dissertation
Publisher
부경대학교 대학원
URI
https://repository.pknu.ac.kr:8443/handle/2021.oak/13093
http://pknu.dcollection.net/jsp/common/DcLoOrgPer.jsp?sItemId=000002236221
Affiliation
부경대학교 대학원
Department
대학원 시스템경영공학과
Advisor
구평회
Table Of Contents
Ⅰ 서론 1
1.1 빅데이터 시대와 데이터 사이언스 1
1.2 주가 분석과 데이터 마이닝 2
1.3 연구 목표 3
Ⅱ 관련 연구 4
2.1 경제학적 배경 5
2.1.1 효율적 시장 가설과 행동 경제학 5
2.1.2 시장 예측 가능성 6
2.1.3 기술적 분석과 기본적 분석 7
2.2 주가 등락 예측을 위한 뉴스 텍스트 마이닝 연구 9
2.2.1 데이터셋 선정 11
2.2.2 데이터 전처리 과정 12
2.2.3 기계 학습 알고리즘 14
Ⅲ 뉴스 텍스트 마이닝을 이용한 주가 예측 모형 17
3.1 연구 과정 요약 17
3.2 텍스트 마이닝 과정 18
3.2.1 데이터 수집 과정 18
3.2.2 데이터 전처리 23
3.2.3 기계 학습 및 기타 사항 30
3.2.4 예측 결과를 이용한 투자 방법 32
3.3 언어 표현에 대한 추가 적용 방안 제시 34
3.3.1 Word2vec을 이용한 단어 라벨링 34
3.3.2 단어의 언급 추세를 활용한 단어 트렌드 38
Ⅳ 실험 설계 및 결과 39
4.1 실험 설계 39
4.1.1 데이터 수집 39
4.1.2 데이터셋 선정 39
4.1.3 실험 비교 분석 과정 40
4.2 실험 결과 41
4.2.1 N-Gram 적용에 따른 실험 결과 42
4.2.2 단어 트렌드에 따른 실험 결과 43
4.2.3 단어 라벨링에 따른 실험 결과 45
4.3 실험 비교 분석 및 평가 46
4.3.1 변수 선택법의 효과 확인 46
4.3.2 기존의 방법과 제시된 방법 간의 비교 분석 48
4.3.3 주가 정보를 이용한 추가 실험 결과 및 비교 50
Ⅴ 결론 52
5.1 연구 의의 52
5.2 실험 평가 53
5.3 미래 연구 방향 54
References 55
Degree
Master
Appears in Collections:
대학원 > 시스템경영공학과
Authorize & License
  • Authorize공개
Files in This Item:

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.