Cloud-based e-Discovery System for Implementing the Public Service of Digital Investigation
- Alternative Title
- 디지털 수사의 공공 서비스 실현을 위한 클라우드 기반 전자증거개시 시스템
- Abstract
- 정보가 중심이 되어 가치를 만들어 내는 사회 경제 활동을 의미하는 정보화 시대의 도래와 급속한 통신 기술의 발전에 따라 컴퓨터와 같은 디지털 장치들의 사용이 보편화 되면서, 일상생활을 비롯하여 업무에 이르기까지 이와 같은 도구들에 대한 현대인들의 의존성은 나날이 증가하고 있다. 이로 인해 발생하는 역기능들 중 가장 심각한 문제는 정보 기술 발전의 이기가 새로운 범죄의 대상이나 수단으로 활용되고 있다는 점이다. 특히 컴퓨터나 인터넷과 연관된 범죄는 매년 폭발적인 증가세를 보이고 있으며, 범죄 유형 또한 급속도로 다양해지고 있다. 이 뿐 아니라, 직접적인 수단으로 활용되지 않더라도 범죄와 관련된 증거 자료들이 각종 디지털 기기에 저장되어 있는 사례가 일반화 되면서, 사안의 진상을 명확하게 밝히기 위한 과학 수사와 이를 뒷받침할 수 있는 디지털 포렌식 기술 개발이 보다 중요시 되고 있다. 특히 전자증거개시 제도의 등장과 민사소송 증가에 따른 포렌식 기술에 대한 민간 수요의 확장, 수사 참여 인력의 다양화에 따른 협업 중요도 증가, 빅데이터 문제로 야기된 새로운 포렌식 분야의 요구사항들을 만족시키기 위해서는 전통적인 디지털 포렌식 절차 및 활용 기술에 관한 새로운 패러다임이 제시되어야 한다. 이에, 본 논문에서는 일부 전문가들에 의해서만 사용되던 디지털 수사 기법 및 지원 도구들을 누구나 쉽게 이용 가능한 공공의 서비스로 제공하기 위해 클라우드 컴퓨팅 기술들을 기반으로 설계한 E-Discovery 서비스 구조를 제안한다. 또한 디지털 수사 업무 중 가장 많은 비중을 차지하는 증거 검색과 적합성 검토 작업의 효율성을 높이기 위해 E-Discovery 서비스 구현을 위한 요소 기술로써, 빅데이터를 대상으로 하는 하둡 기반의 개선된 고속 인덱싱 기법을 개발하고, 그 성능을 실험 평가한다. 마지막으로 증거 검색 결과의 정확도 향상을 위해 데이터마이닝 기술 중 하나인 기계 학습 기법들을 활용하여, 자동화된 소장 분석 및 질의 추천 기법을 설계하고, 구현된 결과물에 대한 실험 평가를 통해 활용 가치를 분석한다.
- Author(s)
- 이태림
- Issued Date
- 2014
- Awarded Date
- 2014. 8
- Type
- Dissertation
- Publisher
- 부경대학교
- URI
- https://repository.pknu.ac.kr:8443/handle/2021.oak/12304
http://pknu.dcollection.net/jsp/common/DcLoOrgPer.jsp?sItemId=000001967169
- Alternative Author(s)
- Taerim Lee
- Affiliation
- 대학원
- Department
- 대학원 정보보호학협동과정
- Advisor
- 신상욱
- Table Of Contents
- List of Tables ⅴ
List of Figures ⅶ
Abstract ⅸ
Chapter 1. Introduction 1
1.1 Digital Investigation 1
1.2 Challenges on Big Data in Digital Investigation 5
1.3 Contributions 7
1.4 Organization of the Thesis 12
Chapter 2. Preliminary 15
2.1 Background of Digital Investigation 15
2.1.1 Digital Evidence 15
2.1.2 Digital Forensics 17
2.1.3 E-Discovery 21
2.1.4 Electronic Discovery Reference Model 25
2.2 Technical Overview of Big Data Processing 28
2.2.1 Machine Learning 28
2.2.2 Apache Hadoop 28
2.2.3 MapReduce Framework 31
2.2.4 Cloud Computing 33
2.3 The Legal Track of TREC 34
2.3.1 Information Retrieval in Legal Domain 35
2.3.2 Overview of Task 39
2.3.3 Topics and Queries 41
Chapter 3. E-Discovery as a Service 45
3.1 The Need for Change of Digital Investigation Methodology 45
3.2 Requirement Analysis 48
3.2.1 Major Functions of Existing Solutions 48
3.2.3 The Impact of IT Compliance 48
3.2.4 Market and Trend of Solution Development 49
3.3 Design of EDaaS 52
3.3.1 The Conceptual Design 52
3.3.2 Convergence of E-Discovery Solutions and Cloud Computing 54
3.3.3 Architecture 55
3.3.4 Use Scenario 59
3.4 Implementation of EDaaS Prototype 62
3.4.1 Implementation Methods for Core Functions 63
3.4.2 Web-based User Interface 64
3.4.3 Basic Functions for Application Server 65
3.5 Analysis about Practicality of EDaaS 67
3.5.1 Advantages 68
3.5.2 Limitations 69
3.5.3 Development Direction for Improving EDaaS 70
Chapter 4. Distributed Text Processing System 71
4.1 New Challenges of Digital Investigation 71
4.2 Distinctions between DTPS and Similar Researches 74
4.2.1 Distributed Lucene 74
4.2.2 Katta 75
4.2.3 Forensic Indexed Search System: HFSS 78
4.3 Efficient Implementation with Hadoop 78
4.3.1 Design 79
4.3.2 Basic Requirements 81
4.3.3 Implementation Strategy for Differentiated Experimental Design 85
4.4 Evaluation Result and Analysis 89
4.4.1 Configurations for DTPS Test 90
4.4.2 Test Results and Analysis 91
Chapter 5. Query Recommending Scheme 97
5.1 Limitations on Actual E-Discovery Process 97
5.2 The Main Considerations about Complaint 98
5.3 The Proposed Scheme for Query Recommending 100
5.3.1 Notations and Functions 100
5.3.2 Workflow 102
5.4 Implementation of QRS 106
5.4.1 Development Environment 106
5.4.2 Design and Implementation of Primary Functions 108
5.5 Performance Evaluation 117
5.5.1 Experimental Design 117
5.5.2 Document Collection and QRELS 119
5.5.3 The Results of Experiments 120
5.5.4 Analysis of Experimental Results 123
5.5.5 Expected Advantages of QRS 126
Chapter 6. Conclusion 128
References 131
- Degree
- Doctor
-
Appears in Collections:
- 대학원 > 정보보호학협동과정
- Authorize & License
-
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.