Joint Accelerated Failure Time Random-effect Modeling Approach for Clustered Competing-risks Data
- Abstract
- Two important classes of survival regression models have been widely used for time-to-event (survival data), i.e., proportional hazards (PH) model and accelerated failure time (AFT) model. The former describes the relationship between the hazard function and covariates, whereas the latter directly describes the linear relationship between survival time and covariates so that it’s much easier to interpret. It is also well known that the estimated regression parameters in the AFT model are robust against the misspecification of the assumed model. Thus, the AFT model is a useful alternative to the Cox PH model. Clustered or multivariate survival data are often encountered in biomedical field where a dependence among event times occurs because of clustering (e.g., center, subject and family) in survival analysis. Random effects can be used for modeling the correlated survival data. Competing-risks data also arise in a clinical study such as a multi-center clinical trial when the occurrence of an event hinders observation of other types of events. These competing-risks data have been usually analyzed using hazard-based models (e.g., PH models), whereas not survival times themselves.
In this dissertation, we propose a cause-specific joint AFT modeling approach to model clustered competing-risks data. Times to competing events are assumed to be log-linear with normal errors and correlated through a scaled random effect that follows a zero-mean normal distribution. Inference on the model parameters is based on the hierarchical likelihood (h-likelihood) which avoids the intractable integrations for random effects to obtain marginal likelihood. We derive the h-likelihood estimation procedure under the proposed model and study its statistical properties. For evaluating the validity and performance of the proposed method, extensive simulation studies are conducted. Simulation results demonstrate the robustness of the estimated regression parameters against the violation of assumed parametric distributions. The proposed method is illustrated with two real multi-center competing-risks data sets.
Furthermore, a variable selection method for fixed effects using a penalized h-likelihood procedure is also proposed under the proposed model. Simulation studies and real data analysis are presented for evaluating the performance of penalized variable selection method. Finally, three extensions are studied based on the proposed model, with simulations and real data examples. First is the cause-specific joint AFT model allowing for correlation between random effects. Second is the prediction of random effects and its robustness. Last is an extension to three types of events. |두 가지 중요한 형태의 생존모형으로 비례위험모형과 가속화 실패시간모형이 생존분석에서 폭 넓게 사용되어 왔다. 전자는 위험함수와 공변량과의 관계를 모형화 하는 반면, 후자는 생존 시간과 공변량 간의 선형적 관계를 바로 모형화 하기 때문에 모형 해석이 보다 쉽다. 가속화 실패시간모형의 추정된 회귀 모수는 가정된 모형의 잘못된 지정에 대해 강건하다는 사실이 잘 알려져 있다. 따라서 가속화실패시간 모형은 Cox의 비례위험모형에 대한 하나의 유용한 대안이다. 생∙의학연구에서 군집화 (예: 센터, 개체, 가족)로 인해 생존 데이터들간 의존성을 갖는 군집화 된 다변량 생존 데이터가 종종 관측된다. 이러한 다변량 데이터는 변량효과를 통해 모형화 할 수 있다. 다른 사건의 발생으로 인해 관심사건의 발생을 방해하는 경쟁위험 데이터가 다기관 임상시험과 같은 임상연구에서 또한 발생된다. 이러한 경쟁위험 데이터는 통상적으로 생존시간 자체가 아닌 위험기반 모형 (예: 비례위험모형)을 사용하여 분석되어 왔다.
이 논문에서 군집화 된 경쟁위험 데이터를 모형화 하기 위해 원인별 결합 가속화실패시간 모델링 접근법을 제안한다. 여기서 경쟁사건시간은 로그 선형하의 정규분포에 기반한 변량효과를 가정한다. 이 모형의 모수는 계층 가능도를 기반으로 추론하고자 한다. 특히 계층 가능도는 주변 가능도를 얻기 위해 필요한 변량효과에 대한 어려운 적분을 피하는 장점이 있다. 본 논문에서 계층 가능도 추정 절차를 유도하고, 그것의 통계적 성질을 또한 연구한다. 확장된 모의실험을 통해 제안된 방법의 타당성 및 우수성을 평가하고, 두개의 경쟁위험 다기관 실제 임상데이터를 통해 제안된 방법을 예증하고자 한다.
나아가, 제안된 모형 하에서 벌점 계층 가능도를 이용하여 고정효과의 변수선택 방법을 또한 제안한다. 모의실험과 실제 데이터 분석을 통해 제안된 변수선택 방법의 우수성을 제시한다. 마지막으로, 제안된 모형의 세 가지 확장을 연구한다. 즉, 변량효과들간 상관성을 갖는 경우, 변량효과의 예측 및 강건성, 그리고 세 가지 형태의 경쟁위험 사건으로의 확장 연구이다.
- Author(s)
- HAO LIN
- Issued Date
- 2023
- Awarded Date
- 2023-02
- Type
- Dissertation
- Publisher
- 부경대학교
- URI
- https://repository.pknu.ac.kr:8443/handle/2021.oak/32944
http://pknu.dcollection.net/common/orgView/200000663730
- Affiliation
- Pukyong National University, Graduate School
- Department
- 대학원 통계학과
- Advisor
- 하일도
- Table Of Contents
- I. INTRODUCTION 1
II. LITERATURE REVIEW 4
2.1 Accelerated failure time models 4
2.2 Competing risks models 9
III. JOINT AFT RANDOM-EFFECT MODEL FOR CLUSTERED COMPETING-RISKS DATA 15
3.1 Modeling approach 16
3.1.1 Model formulation 16
3.1.2 H-likelihood construction 18
3.2 Estimation procedure 19
3.2.1 Estimation of the fixed and random effects 19
3.2.2 Estimation of dispersion parameters 22
3.3 Simulation study 24
3.3.1 Simulation design 25
3.3.2 Simulation results 29
3.4 Examples 41
3.4.1 Multi-center bladder cancer data 41
3.4.2 Multi-center BMT data 47
IV. VARIABLE SELECTION FOR THE PROPOSED MODEL 49
4.1 Variable selection procedure 50
4.1.1 Estimation procedure for variable selection 52
4.1.2 Standard error and selection of tuning parameter 54
4.2 Simulation study 55
4.2.1 Simulation design 55
4.2.2 Simulation results 57
4.3 Examples 62
4.3.1 Multi-center bladder cancer data 62
4.3.2 Multi-center BMT data 65
V. EXTENSION 67
5.1 The cause-specific joint AFT model with correlated random effects 67
5.1.1 Model formulation 67
5.1.2 H-likelihood construction 68
5.1.3 Estimation procedure 69
5.1.4 Simulation study 73
5.1.5 Examples 79
5.2 Prediction of random effects and its robustness 82
5.3 Extension to three types of events 110
VI. DISCUSSION 115
6.1 Conclusion 115
6.2 Further works 117
REFERENCES 118
Abstract (in Korean) 127
APPENDIX 128
A. Proof of equation (3.1.2) 128
B. Proof of Theorem 3.1 128
C. Supplementary materials for Chapter 3 130
C.1 Derivatives of the REML estimates of ϕ1 and ϕ2 131
C.2 Derivatives of the REML estimate of α 133
D. Supplementary materials for Chapter 5 134
D.1 Derivatives of the REML estimates of ϕ1 and ϕ2 135
D.2 Derivatives of the REML estimate of α1 and α2 137
- Degree
- Doctor
-
Appears in Collections:
- 대학원 > 통계학과
- Authorize & License
-
- Authorize공개
- Embargo2028-02-29
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.