PUKYONG

Cloud-based e-Discovery System for Implementing the Public Service of Digital Investigation

Metadata Downloads
Alternative Title
디지털 수사의 공공 서비스 실현을 위한 클라우드 기반 전자증거개시 시스템
Abstract
정보가 중심이 되어 가치를 만들어 내는 사회 경제 활동을 의미하는 정보화 시대의 도래와 급속한 통신 기술의 발전에 따라 컴퓨터와 같은 디지털 장치들의 사용이 보편화 되면서, 일상생활을 비롯하여 업무에 이르기까지 이와 같은 도구들에 대한 현대인들의 의존성은 나날이 증가하고 있다. 이로 인해 발생하는 역기능들 중 가장 심각한 문제는 정보 기술 발전의 이기가 새로운 범죄의 대상이나 수단으로 활용되고 있다는 점이다. 특히 컴퓨터나 인터넷과 연관된 범죄는 매년 폭발적인 증가세를 보이고 있으며, 범죄 유형 또한 급속도로 다양해지고 있다. 이 뿐 아니라, 직접적인 수단으로 활용되지 않더라도 범죄와 관련된 증거 자료들이 각종 디지털 기기에 저장되어 있는 사례가 일반화 되면서, 사안의 진상을 명확하게 밝히기 위한 과학 수사와 이를 뒷받침할 수 있는 디지털 포렌식 기술 개발이 보다 중요시 되고 있다. 특히 전자증거개시 제도의 등장과 민사소송 증가에 따른 포렌식 기술에 대한 민간 수요의 확장, 수사 참여 인력의 다양화에 따른 협업 중요도 증가, 빅데이터 문제로 야기된 새로운 포렌식 분야의 요구사항들을 만족시키기 위해서는 전통적인 디지털 포렌식 절차 및 활용 기술에 관한 새로운 패러다임이 제시되어야 한다. 이에, 본 논문에서는 일부 전문가들에 의해서만 사용되던 디지털 수사 기법 및 지원 도구들을 누구나 쉽게 이용 가능한 공공의 서비스로 제공하기 위해 클라우드 컴퓨팅 기술들을 기반으로 설계한 E-Discovery 서비스 구조를 제안한다. 또한 디지털 수사 업무 중 가장 많은 비중을 차지하는 증거 검색과 적합성 검토 작업의 효율성을 높이기 위해 E-Discovery 서비스 구현을 위한 요소 기술로써, 빅데이터를 대상으로 하는 하둡 기반의 개선된 고속 인덱싱 기법을 개발하고, 그 성능을 실험 평가한다. 마지막으로 증거 검색 결과의 정확도 향상을 위해 데이터마이닝 기술 중 하나인 기계 학습 기법들을 활용하여, 자동화된 소장 분석 및 질의 추천 기법을 설계하고, 구현된 결과물에 대한 실험 평가를 통해 활용 가치를 분석한다.
Author(s)
이태림
Issued Date
2014
Awarded Date
2014. 8
Type
Dissertation
Publisher
부경대학교
URI
https://repository.pknu.ac.kr:8443/handle/2021.oak/12304
http://pknu.dcollection.net/jsp/common/DcLoOrgPer.jsp?sItemId=000001967169
Alternative Author(s)
Taerim Lee
Affiliation
대학원
Department
대학원 정보보호학협동과정
Advisor
신상욱
Table Of Contents
List of Tables ⅴ
List of Figures ⅶ
Abstract ⅸ
Chapter 1. Introduction 1
1.1 Digital Investigation 1
1.2 Challenges on Big Data in Digital Investigation 5
1.3 Contributions 7
1.4 Organization of the Thesis 12

Chapter 2. Preliminary 15
2.1 Background of Digital Investigation 15
2.1.1 Digital Evidence 15
2.1.2 Digital Forensics 17
2.1.3 E-Discovery 21
2.1.4 Electronic Discovery Reference Model 25
2.2 Technical Overview of Big Data Processing 28
2.2.1 Machine Learning 28
2.2.2 Apache Hadoop 28
2.2.3 MapReduce Framework 31
2.2.4 Cloud Computing 33
2.3 The Legal Track of TREC 34
2.3.1 Information Retrieval in Legal Domain 35
2.3.2 Overview of Task 39
2.3.3 Topics and Queries 41

Chapter 3. E-Discovery as a Service 45
3.1 The Need for Change of Digital Investigation Methodology 45
3.2 Requirement Analysis 48
3.2.1 Major Functions of Existing Solutions 48
3.2.3 The Impact of IT Compliance 48
3.2.4 Market and Trend of Solution Development 49
3.3 Design of EDaaS 52
3.3.1 The Conceptual Design 52
3.3.2 Convergence of E-Discovery Solutions and Cloud Computing 54
3.3.3 Architecture 55
3.3.4 Use Scenario 59
3.4 Implementation of EDaaS Prototype 62
3.4.1 Implementation Methods for Core Functions 63
3.4.2 Web-based User Interface 64
3.4.3 Basic Functions for Application Server 65
3.5 Analysis about Practicality of EDaaS 67
3.5.1 Advantages 68
3.5.2 Limitations 69
3.5.3 Development Direction for Improving EDaaS 70

Chapter 4. Distributed Text Processing System 71
4.1 New Challenges of Digital Investigation 71
4.2 Distinctions between DTPS and Similar Researches 74
4.2.1 Distributed Lucene 74
4.2.2 Katta 75
4.2.3 Forensic Indexed Search System: HFSS 78
4.3 Efficient Implementation with Hadoop 78
4.3.1 Design 79
4.3.2 Basic Requirements 81
4.3.3 Implementation Strategy for Differentiated Experimental Design 85
4.4 Evaluation Result and Analysis 89
4.4.1 Configurations for DTPS Test 90
4.4.2 Test Results and Analysis 91

Chapter 5. Query Recommending Scheme 97
5.1 Limitations on Actual E-Discovery Process 97
5.2 The Main Considerations about Complaint 98
5.3 The Proposed Scheme for Query Recommending 100
5.3.1 Notations and Functions 100
5.3.2 Workflow 102
5.4 Implementation of QRS 106
5.4.1 Development Environment 106
5.4.2 Design and Implementation of Primary Functions 108
5.5 Performance Evaluation 117
5.5.1 Experimental Design 117
5.5.2 Document Collection and QRELS 119
5.5.3 The Results of Experiments 120
5.5.4 Analysis of Experimental Results 123
5.5.5 Expected Advantages of QRS 126

Chapter 6. Conclusion 128
References 131
Degree
Doctor
Appears in Collections:
대학원 > 정보보호학협동과정
Authorize & License
  • Authorize공개
Files in This Item:

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.