반복측정 개수 데이터에 대한 딥러닝 변량효과 모델링 접근법
- Abstract
- 딥러닝 핵심모형인 심층 신경망 (deep neural network; DNN) 모형은 입력변수와 출력변수 간 비선형 함수관계를 은닉층을 통해 모형화함으로써 다양한 분야에서 수반되는 출력변수의 예측이나 분류문제에 높은 예측력을 제공하고 있다. 하지만 DNN 모형은 출력변수가 독립인 경우에 주로 개발 되어져 왔기 때문에, 출력변수들 간 상관성 (correlation or dependency)이 있을 때 DNN을 바로 적용하는 것은 예측 성능이 크게 떨어지는 단점이 있다. 이러한 상관성은 변량효과(random effect)를 통해 통상적으로 모형화 되지만 변량효과모형은 입⦁출력변수 간 함수관계가 선형성 가정하에서 주로 개발 되어져 왔다.
본 논문에서는 출력변수가 반복측정 개수 데이터 (repeated measures count data)와 같이 상관성 구조를 가지는 경우, 변량효과 및 DNN에 기반한 새로운 포아송-DNN 변량효과모형 (Poisson DNN random-effect model)을 제안한다. 제안된 모형의 추정(학습)을 위해 손실함수 (loss function)로서 음의 주변가능도 (negative marginal likelihood)에 기반한 최적화 알고리즘을 개발한다. 모의실험 및 실제 데이터 분석을 통해 제안된 방법의 타당성을 보인다. 특히 모의실험 결과에 의하면 제안된 DNN 모형은 기존의 예측모형들보다 더 높은 예측 성능을 제공함을 확인하였다.| The deep neural network (DNN) model, a core model of deep learning, provides high predictive power to predict and classify output variables involved in various fields by modeling the nonlinear functional relationship between input and output variables through hidden layers. However, since the DNN has been mainly developed when output variables are independent, applying it immediately when there is a correlation between output variables has a disadvantage in that prediction performance is greatly reduced. This correlation is usually modeled via random effects, but the random effect model has been mainly developed under the assumption of linearity in the functional relationship between input and output variables.
In this paper, we propose a new Poisson DNN random-effect model based on random effects and DNN when the output variables consist of correlated count both outcomes obtained from the repeated measures over time or under some condition within a subject. For estimation (learning) of the proposed model, we develop an optimization algorithm based on negative marginal likelihood as a loss function. Simulation and real data analysis demonstrate the validity of the proposed method. In particular, the simulation results confirmed that the proposed DNN model provides higher prediction performance than the existing prediction models.
- Author(s)
- 김지훈
- Issued Date
- 2023
- Awarded Date
- 2023-02
- Type
- Dissertation
- Publisher
- 부경대학교
- URI
- https://repository.pknu.ac.kr:8443/handle/2021.oak/33074
http://pknu.dcollection.net/common/orgView/200000668531
- Affiliation
- 부경대학교 대학원
- Department
- 대학원 통계학과
- Advisor
- 하일도
- Table Of Contents
- 제 1장 서론 1
제 2장 딥러닝 모형과 변량효과 모형 3
2.1 심층신경망 모형 3
2.2 포아송 변량효과모형 접근법 6
제 3장 포아송 딥러닝 변량효과 모형 10
3.1 포아송 딥러닝 변량효과 모형 10
3.2 학습 알고리즘 13
3.3 모형성능 평가 14
제 4장 모의실험 연구 15
4.1 모의실험 설계 15
4.2 모의실험 결과 18
제 5장 실제 데이터 분석 28
제 6장 결론 및 제언 32
참고문헌 33
- Degree
- Master
-
Appears in Collections:
- 대학원 > 통계학과
- Authorize & License
-
- Authorize공개
- Embargo2023-02-08
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.