Studies on transcriptomic analysis of fish infected with pathogens using a gene co-expression network-based approach
- Abstract
- Although RNA sequencing (RNA‐seq) has become increasingly popular for transcriptome profiling due to developed next generation sequencing (NGS) technology, there are still limited methods to obtain biologically meaningful information. The main objective of this study was to investigate and compare methods for transcriptome analysis to achieve comprehensive understanding of host responses occurring during bacterial or viral infection.
In Chapter I, fish-pathogen transcriptome datasets were prepared. Iso-seq technology was applied to construct a full-length transcriptome for rock bream (Oplegnathus fasciatus) and rockfish (Sebastes schlegelii), as their genome sequences are not available. The full-length transcriptome was used for mapping of short-read transcripts obtained from rock bream and rockfish infected with RBIV and A. salmonicida, respectively. As a result, 60,060 unigene (88.05%) in RB-RBIV and 65,256 unigene (89.89%) in RF-RFAS1 were mapped. In addition, validity and reliability of sequences generated by NGS platform were verified by perfoming qRT-PCR.
In Chapter II, differential expression gene (DEG) analysis was performed with above two transcriptome datasets using Tag Count Comparison (TCC) package. In functional analysis, it was found that some genes that are biologically important could be excluded from further analysis (e.g., DNA replication, mismatch repair pathway in DEG1 of RB-RBIV). This is because DEGs are only genes showing statistically significance (q-value<0.05). Also, there was a limit to understand changes in a group of genes related to a pathway or reaction, or genes expressed simultaneously, since DEG analysis is based on one-to-one correspondence.
In Chapter III, signed co-expression network analysis with two transcriptome datasets was performed using WGCNA package. Genes showing similar expression patterns were clustered as a module based on similarity and adjacency expression patterns between genes. Significant modules were selected by calculating correlation between viral load in RB-RBIV and bacterial concentration (Challenged and Recoverd) in RF-RFAS1 and module (
GS vs. MM
> 0.5, p-value <0.05). In functional analysis, each module showed unique characteristics, and genes in a given module are functioned in the same category, suggesting that they are co-regulated with similar functions. Furthermore, hub genes that can control many functions during the infection was selected to use as a biomarker candidate. Since unsigned network takes into account only connection strength without considering the sign of expression patterns, this can lead to confusion in the interpretation of biologically relevant information. In this study, signed network analysis enabled to analyze several groups in association with various factors, and to provide more meaningful data compared to DEG analysis.
In Chapter IV, a few hypotheses based on the results obtained from signed co-expression network analysis were established. qRT-PCR assay was performed to verify them using rock bream or rockfish blood cells infected with pathogens. As a result, RBIV manipulated host machinery for their replication, transcription, and translation, and increase glycolysis activity. However, it is suggested the host defense of rock bream might fail due to significantly decreased expression of genes involved in antigen presentation, signaling pathway, lymphocyte-mediated immune system, and platelet activation, and induction of endogenous apoptosis. In RF-RFAS1, A. salmonicida could invade into host cells via fibronectin, and induce pyroptosis, a programmed cell death. In addition, down-regulation of genes involved in MHC class I and II, extracellular matrix and receptor appeared to weaken cell integrity and antigen presentation, thereby avoiding host immune responses. A hub gene, PRPF19, might be a potential biomarker for diagnosis and vaccine studies in rock bream against RBIV.
In conclusion, findings in this study provide insight into interaction between fish and an important pathogen, and fundamental information for the prevention of the disease. This study is also very essential in terms of methodology, as it shows a new direction and possibility of co-expression network analysis for fish transcriptome analysis.
최근 10년간 차세대 시퀀싱 (NGS) 기술의 발달로 전사체 분석이 비교적 쉽게 접근 가능하게 되었다. 하지만, 대량의 데이터를 다루어야 함에도 불구하고 분석에 이용 가능한 tool이 제한적이고, 아직 유전체 및 전사체 데이터베이스가 부족한 어류와 같은 생물로부터 획득한 결과를 이용하여 생물학적으로 의미 있는 정보를 얻는데 많은 한계가 있다. 이에 이번 연구의 목적은 오류를 최소화하면서 신뢰도를 높일 수 있는 전사체 분석 방법을 모색하고, 이를 Rock bream iridovirus (RBIV)에 감염된 돌돔 (Oplegnathus fasciatus)과 Aeromonas salmonicida subsp. masoucida에 감염된 조피볼락 (Sebastes schlegelii)의 비장과 신장의 전사체 분석에 적용하여 병원체와의 상호작용에서 나타나는 숙주의 변화를 포괄적으로 이해하는 것에 있었다.
Chapter I에서는 Iso-seq 기술을 적용하여 이용가능한 유전체가 없는 돌돔과 조피볼락의 full-length transcriptome을 마련하였고, RBIV에 감염된 돌돔 및 대조구의 비장 (RB-RBIV라 명함)과 A. salmonicida에 감염된 조피볼락 및 대조구의 신장 (RF-RFAS1이라 명함)에서의 RNA-seq 결과 생성된 short-read transcript를 mapping하는데 이용되었다. 그 결과 RB-RBIV의 read는 60,060 unigene (88.05%), RF-RFAS1의 read는 65,256 unigene (89.89%)이 mapping되었다. 또한, qRT-PCR을 이용하여 NGS에 의해 생성된 sequence, 즉 어류-병원체 전사체 데이터의 유효성을 입증하였다.
Chapter II에서는 Tag Count Comparison (TCC) package를 이용하여 위의 두 전사체 데이터로 차등발현 유전자 (DEG) 분석을 수행하였다. 생성된 DEG들의 (q-value < 0.05) 기능 분석을 수행한 결과, 통계학적으로 유의적인 유전자만을 분석에 사용하기 때문에 생물학적으로 중요한 정보를 담고 있을 수 있는 유전자가 추후의 분석에서 배제됨을 확인하였다 (예-DNA replication, mismatch repair pathway in DEG1 of RB-RBIV). 뿐만 아니라 연속 또는 동시에 발현되는 전사체의 변화를 파악하는 것에 있어 한계를 확인하였다.
Chapter III에서는 Weighted gene co-expression network analysis (WGCNA) 패키지를 이용한 signed co-expression network analysis으로 전사체를 분석하였다. 유전자들의 발현 패턴의 유사도 (similarity)와 인접도 (adjacency)를 계산하여 유사한 발현패턴을 가진 유전자 집단 (module)을 설정하였으며, 관심있는 임상 증상과 이 module과의 상관관계를 계산하여 선정된 module (
GS vs. MM
> 0.5, p-value < 0.05) 내 유전자들은 기능적 annotation에서 같은 카테고리에 묶이며, 이는 이들이 유사한 기능을 가지고 함께 조절되는 것을 시사한다. 뿐만 아니라 hub gene을 탐색함으로써 감염 시 많은 기능을 조절할 수 있는 후보 바이오마커를 선정하였다. Unsigned network analysis는 유전자 발현패턴의 상관관계에서 부호, 즉 방향을 고려하지 않고 연결강도만을 고려하기 때문에 module 내 유전자들의 상관관계는 높게 나타났지만 이는 생물학적으로 관련된 정보의 해석이 혼란스러울 수 있음을 확인하였다. Signed network analysis는 DEG 분석에 비해 여러 인자, 여러 그룹을 동시에 분석할 수 있으며, 적은 유전자들을 가지고도 동시에 발현되는 유전자들에 대한 심도있는 생물학적인 해석을 가능하게 하였다.
Chapter IV에서는 Chapter III의 결과에 기반하여 병원체에 감염된 어류에서 나타나는 반응에 대한 가설을 설립하고, 병원체와 작용을 하는 혈구에서의 유전자 발현을 조사하여 이를 검증하였다. 먼저, RBIV에 중감염 된 돌돔에서, RBIV는 그들의 복제, 전사, 번역, 에너지 획득을 위해 cell cycle, spliceosome, copII, glycolysis (Warbrug effect)와 같은 숙주의 machinery를 이용하는 반면, entrinsic apoptosis 유도, autophagy, antigen presentation, cytoskeleton, signaling pathway, lymphocyte-mediated immune system, platelet activation 등에 관여하는 유전자들의 발현 감소하였고, 이에 숙주의 방어가 실패하는 것으로 사료된다. 또한, A. salmonicida에 감염된 조피볼락에서는, fibronectin과의 상호작용을 통한 숙주 세포 내로의 침입, NOD-like receptor인 NLRP12를 비롯하여 PYCARD, caspase-1, IL-1β가 관여하는 pyroptosis에 대한 증거를 확보하였다. 또한, MHC class I과 II, 세포외 기질 및 receptor에 관여하는 유전자들의 감소는 cell integrity 및 항원 제시 기능을 약화시켜 숙주의 면역 반응을 회피하는 것으로 보인다. 뿐만 아니라 Chapter III에서 탐색된 hub gene, 특히 PRPF19는 돌돔의 RBIV 감염에 대한 진단 및 백신 연구를 위한 바이오마커로서의 가능성을 제공한다.
본 연구는 어류 전사체에 공발현 분석을 적용한 연구로 어류 전사체 연구의 방법에 대한 새로운 방향을 제시한다. 또한, 공발현 분석을 통해 확인된 돌돔 및 조피볼락의 주요 병원체와의 상호작용은 향후 감염병학, 백신 개발 등의 다양한 연구에 있어 기초 연구자료로 제공될 수 있다.
- Author(s)
- 김아란
- Issued Date
- 2019
- Awarded Date
- 2019. 8
- Type
- Dissertation
- Keyword
- Bioinformatics RBIV A. salmonicida Transcriptomics Co-expression
- Publisher
- 부경대학교
- URI
- https://repository.pknu.ac.kr:8443/handle/2021.oak/23497
http://pknu.dcollection.net/common/orgView/200000225563
- Alternative Author(s)
- Ahran Kim
- Affiliation
- 부경대학교 대학원
- Department
- 대학원 수산생명의학과
- Advisor
- 김도형
- Table Of Contents
- Chapter I. Dataset preparation and transcriptome overview 1
1.1. Introduction 2
1.2. Materials and methods 6
1.2.1. Fish and experimental design 6
1.2.1.1. Rock bream infected with RBIV 6
1.2.1.1.1. Fish 6
1.2.1.1.2. RBIV detection and quantification of viral DNA in the spleen 7
1.2.1.2. Rockfish infected with A. salmonicida 8
1.2.2. Sample preparation for transcriptome analysis 9
1.2.3. Full-length transcript sequencing (Iso-seq) and CDSs prediction 9
1.2.4. cDNA library construction and sequencing from sample tissues 10
1.2.5. De novo assembly and functional annotation of unigenes 10
1.2.6. Experimental validation with qRT-PCR 11
1. 3. Results 14
1.3.1. Clinical signs 14
1.3.1.1. Rock bream 14
1.3.1.2. Rockfish 16
1.3.2. Overview of transcriptome data 18
1.3.2.1. Rock bream 18
1.3.2.2. Rockfish 18
1.3.3. Functional annotations 20
1.3.3.1. Gene ontology (GO) assignments for unigenes generated from Iso-seq 20
1.3.3.2. KEGG annotations for unigenes generated from Iso-seq 22
1.3.4. Validation by qPCR 25
1.3.4.1. Rock bream 25
1.3.4.2. Rockfish 26
1.4. Discussion 27
Chapter II. Transcriptome analysis based on differential expressed genes (DEGs) 29
2.1. Introduction 30
2.2. Materials and methods 32
2.2.1. Differential expressed genes (DEGs) analysis 32
2.2.2. Functional annotations of DEGs 32
2.3. Results and Discussion 33
2.3.1. DEGs overview 33
2.3.1.1. Rock bream 35
2.3.1.2. Rockfish 35
2.3.2. Functional annotations 38
2.3.2.1. Rock bream 38
2.3.2.2. Rockfish 45
Chapter III. Transcriptome analysis based on Gene co-expression network analysis 52
3.1. Introduction 53
3.2. Materials and methods 55
3.2.1. Construction of co-expression network and module identification 55
3.2.2. Relating modules to clinical traits 56
3.2.3. Functional enrichment analysis 56
3.3. Results 58
3.3.1. Co-expression network analysis with RB-RBIV dataset 58
3.3.1.1. Signed network construction of RB-RBIV dataset 59
3.3.1.2. Functional enrichment analysis 66
3.3.1.3. Detection of hub genes 72
3.3.2. Co-expression network analysis with RF-RFAS1 dataset 75
3.3.2.1. Signed network construction of RF-RFAS1 dataset 76
3.3.2.2. Functional enrichment analysis 83
3.3.2.2.1. Changes in H-group over time (H1D and H5D) 83
3.3.2.2.2. Differences at early stages of infection (L1D and H1D) 84
3.3.2.2.3. Differences in L5D and H-group 84
3.3.2.3. Detection of hub genes 89
3.4. Discussion 93
3.4.1. Comparisons between unsigned and signed network analysis 95
3.4.1.1. Unsigned network analysis of RB-RBIV dataset 95
3.4.1.2. Unsigned network analysis of RF-RFAS1 dataset 98
3.4.2. Comparisons between co-expression and DEG analysis 103
Chapter IV. Experimental validation and Possible scenario of host response against infection 108
4.1. Introduction 109
4.1.1. Rock bream infected with RBIV 109
4.1.2. Rockfish infected with A. salmonicida subsp. masoucida 110
4.2. Materials and Methods 112
4.2.1. Ex vivo infection of rock bream blood cells with RBIV 112
4.2.2. Ex vivo infection of rockfish blood cells with A. salmonicida 112
4.2.3. Total RNA extraction and cDNA synthesis 113
4.2.4. Primers design and gene expression analysis 113
4.3. Results 117
4.3.1. Gene expression in RBIV-infected blood cells of rock bream 117
4.3.2. Gene expression in rockfish blood cells infected with A. salmonicida 121
4.4. Possible scenario and Discussion 125
4.4.1. Rock bream infected with RBIV 125
4.4.2. Rockfish infected with A. salmonicida subsp. masoucida 141
4.5. Conclusion 149
Summary 150
Appendix 153
감사의 글 187
References 188
- Degree
- Doctor
-
Appears in Collections:
- 대학원 > 수산생명의학과
- Authorize & License
-
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.