PUKYONG

Prediction of Transmembrane Helical Topology Using Neural Network

Metadata Downloads
Abstract
화학적 메신저와 상호 작용하여 세포의 중요한 생리학적 역할을 담당하는 transmembrane protein (TM 단백질)은 세포막 사이에 위치하기 때문에 그 구조와 동역학을 관측하는 것이 생물학적으로 매우 중요한 의미를 가지고 있다. TM 단백질의 구조와 동역학을 보다 정확히 기술하기 위하여 joint-based descriptor라는 방법이 제안되었다. 이 방법은 TM 나선 양단의 Cα를 하나의 점으로 생각하고 TM 단백질의 구조를 macroscopic level에서 예측할 수 있는 장점이 있다. 하지만 TM 나선 내부의 굽은 구조 (kink)는 기술하지 못한다는 단점을 가지고 있다. 본 논문에서는 TM 나선 양단이 아닌 내부를 분절하는 다중 연결점을 제안한다. 이 연구에서 우리는 3 ~ 14개의 TM나선으로 구성된 101 개의 비 상동 TM 단백질의 PDB구조와 시퀀스 기반의 정보를 이용하여 인공신경망을 학습하였다. 신경망으로부터 얻어진 Cα 원자 기반의 각도 (θ)와 이면각 (τ)을 통해 TM 단백질의 구조를 예측하고 이를 joint-based descriptor와 결합하여 보강된 macroscopic level에서의 최적의 모델을 제안한다.
Author(s)
최수진
Issued Date
2019
Awarded Date
2019. 2
Type
Dissertation
Publisher
부경대학교
URI
https://repository.pknu.ac.kr:8443/handle/2021.oak/23165
http://pknu.dcollection.net/common/orgView/200000183421
Affiliation
부경대학교 대학원
Department
대학원 물리학과
Advisor
우상욱
Table Of Contents
I. Introduction 1
1. Protein structure 1
1.1. Protein and amino acids 1
1.2. Transmembrane protein 4
2. Artificial Neural Network 6
2.1. Artificial neural network architecture 7
2.2. Backpropagation 9
2.3. Gradient descent method 10
2.4. Activation function 13
3. A method for predicting existing angle and dihedral angles 18
4. Neural network for transmembrane protein backbone angle prediction 19
II. Methods 21
1. Datasets 21
1.1. Processing missing data 23
2. Neural-network learning 28
3. Angle notation 30
4. Input 31
4.1. Position Specific Scoring Matrix (PSSM) 31
4.2. Seven representative amino-acid properties (PP) 32
4.3. Predicted secondary structures (SS) 34
4.4. Predicted solvent surface area (ASA) 34
5. Output 35
6. Evaluation 36
6.1. k-fold Cross Validation 37
7. Model parameters 38
7.1. Change the window size with activation function 39
7.2. Change the number of hidden layers 40
7.3. Change the number of hidden nodes 41
7.4. Change the batch size 41
7.5. Dropout 41
III. Results and Discussion 44
1. Without loop dataset 45
1.1. Window size change 45
1.2. Number of hidden layers change 53
1.3. Number of hidden nodes change 56
1.4. Number of batch size change 61
1.5. Dropout 65
2. With loop dataset 73
2.1. Window size change 73
2.2. Number of hidden layers change 81
2.3. Number of hidden nodes change 84
2.4. Number of batch size change 89
2.5. Dropout 93
3. Comparison with loop and without loop dataset 101
4. Comparison with other prediction tool 103
IV. Conclusions 106
Reference 107
Degree
Master
Appears in Collections:
대학원 > 물리학과
Authorize & License
  • Authorize공개
Files in This Item:

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.