One-Stage Copula Modeling Approaches for Clustered Multivariate Survival Data
- Abstract
- Copula survival and frailty models have been widely used to analyze clustered multivariate survival data. The copula models consist of copula function with marginal distribution. The copula model is a marginal model, while the frailty model is a conditional model. In particular, the family of Archimedean copula functions, a broad class of copulas, is useful for modeling such dependency among survival data. However, the inference of copula survival models has been relatively less studied. In general, one- and two-stage estimation methods have been used for likelihood-based inference. The two-stage procedure can provide inefficient estimation results because it estimates the copula's marginal and association parameters separately. However, a more efficient one-stage procedure has been mainly developed under a restrictive parametric assumption of the marginal distribution due to the complexity of the likelihood with an unknown marginal baseline hazard function.
In this thesis, we propose a flexible M-spline Archimedes copula modeling approach using a one-stage likelihood procedure. To reduce the complexity of the likelihood, the unknown marginal baseline hazard is modeled based on the cubic M-spline basis function that does not require a specific parametric form. The estimation procedure of the proposed method is derived and theoretical properties are also studied. Simulation results show that the proposed one-stage estimation method gives a consistent estimator and also provides more efficient estimation results than the existing one- and two-stage methods. The proposed method is illustrated with three practical data examples.
In this thesis, we also propose a variable selection procedure in the copula model using a one-stage estimation method based on a penalized likelihood. The performance of the proposed method is evaluated through simulation studies, and the usefulness of the new method is illustrated using clinical data sets.
군집된 다변량 생존 시간 자료의 분석을 위해 코플라 모형과 프레일티 모형이 폭 넓게 사용되어 왔다. 코플라 모형은 주변 분포와 코플라 함수로 구성된다. 코플라 모형은 주변 모형인 반면에 프레일티 모형은 조건부 모형이다. 특히 대표적 코플라 족인 아르키메데스 코플라 함수는 이러한 자료 간 연관성을 모형화하는 데 유용하다. 일반적으로 코플라 모형에서 가능도 기반한 추론은 1단계 및 2단계 추정 방법이 사용되어왔다. 2단계 추정 절차는 코플라의 주변 모수와 의존성 모수를 독립적으로 추정하기 때문에 비효율적인 추정 결과를 제공할 수 있다. 하지만 효율적인 1단계 추정 절차는 미지의 주변 기저 위험 함수를 갖는 가능도의 복잡성으로 인해 주변 분포의 제한된 모수적 가정하에서 주로 개발되어왔다.
본 논문에서는 1단계 가능도 절차에 기반한 융통성있는 M-스플라인 아르키메데스 코플라 모형 접근법을 제안한다. 즉, 가능도의 복잡성을 줄이기 위해 미지의 주변 기저 위험은 M-스플라인 기저 함수를 기반으로 모형화한다. 제안된 방법의 추정 절차를 유도하고, 이론적 성질을 또한 연구한다. 모의실험에 의하면 제안된 1단계 추정 방법이 기존의 1단계 및 2 단계 방법보다 합리적인 편의 추정 및 보다 효율적인 추론 결과를 제공함을 보여준다. 세 가지 실제 자료의 분석을 통해 제안된 방법을 예증한다. 또한 본 논문에서는 벌점화 가능도를 기반으로 한 1단계 추정 방법을 사용하여 코플라 생존 모형에서 변수선택 절차를 제안한다. 제안된 변수선택 방법의 성능은 모의실험 연구를 통해 입증하고 새로운 방법의 유용성은 두 가지 임상 자료의 분석을 통해 예증한다.
- Author(s)
- 권숙희
- Issued Date
- 2021
- Awarded Date
- 2021. 8
- Type
- Dissertation
- Publisher
- 부경대학교
- URI
- https://repository.pknu.ac.kr:8443/handle/2021.oak/1114
http://pknu.dcollection.net/jsp/common/DcLoOrgPer.jsp?sItemId=200000506108
- Affiliation
- 부경대학교 대학원
- Department
- 대학원 통계학과
- Advisor
- 하일도
- Table Of Contents
- Ⅰ. INTRODUCTION 1
Ⅱ. COPULA AND FRAILTY MODELS 5
2.1. Correlated survival models 6
2.1.1. Copula model 7
2.1.2. Frailty model 13
2.2. The estimation procedures of copula models 15
2.3. Comparison of copula and frailty models 17
2.3.1. Comparison of R packages 18
2.3.2. Data description 20
2.3.3. Simulation study 24
2.3.4. Illustration 27
Ⅲ. ESTIMATION OF COPULA SURVIVAL MODELS 32
3.1. Copula-based likelihood 32
3.2. M-spline modeling for baseline hazards 36
3.3. One-stage estimation procedure 39
3.4. Two-stage estimation procedure 42
3.5. Comparison of one-stage and two-stage procedures 44
Ⅳ. SIMULATION STUDY FOR COPULA SURVIVAL MODELS 46
4.1. Correctly specified copula models 46
4.2. Misspecified copula models 63
Ⅴ. ILLUSTRATION FOR COPULA SURVIVAL MODELS 65
5.1. Kidney infection data 65
5.2. Recurrent CGD data 66
5.3. Multicenter bladder cancer data 67
Ⅵ. PENALIZED VARIABLE SELECTION IN COPULA SURVIVAL MODELS 70
6.1. Construction of penalized likelihood 70
6.2. Penalized variable selection procedure 73
6.3. Fitting algorithm for variable selection 76
6.4. Simulation study for penalized variable selection 77
6.5. Simulation result for penalized variable selection 79
6.6. Illustration for penalized variable selection 87
Ⅶ. DISCUSSIONS 92
References 94
Abstract (in Korean) 100
Appendix A. M-Spline Basis Functions 101
Appendix B. Derivations 103
Appendix C. R Codes 106
Appendix D. Further Simulation Results 113
- Degree
- Doctor
-
Appears in Collections:
- 대학원 > 통계학과
- Authorize & License
-
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.