PUKYONG

Machine-Learning-Based Algorithms for Forecasting Construction Material Price Trends in China

Metadata Downloads
Alternative Title
중국내에서의 건축 자재 가격 예측을 위한 기계학습 기반 알고리듬
Abstract
Given the problems of the global economic slump, the status of the construction industry is extremely important as one of the nation's economic cornerstones. Three major dangers in the construction business are cash flow, on-time delivery, and the availability of skilled labor. The spread of COVID-19 has raised the risk in all three places. It is advantageous to precisely estimate the price trends of construction supplies in order to limit the risks associated with finance, delivery, and even labor availability. This study looks at the design and application of artificial intelligence (AI) algorithms that could be used to more accurately predict how the prices of Chinese building materials will change.
We first investigate the process of creating a time series (TS) dataset and validate the usability of the dataset using various machine learning and deep learning algorithms. Based on these, we propose an improved random forest algorithm (improved RF). The algorithm deeply integrates the characteristics of time series into the construction of random forests (RF) and proposes an improved random forest model more suitable for time series classification tasks (TSC). The model performs well in predicting the price trends of concrete, steel, and oil, with an average prediction accuracy of 94.62%.
We also propose a combined CNN-LSTM model. The model uses a convolutional neural network to extract the spatial rules of the time series, supplemented by a long short-term memory network to extract the temporal rules of the time series. The performance of the model is evaluated based on the concrete dataset and then it has a prediction accuracy of 95.12% for the trend of concrete price movement.
Based on the CNN-LSTM model, we propose a multi-pose marking algorithm. This algorithm can improve the performance of convolutional neural networks in processing time series classification tasks. The algorithm computes multiple pose representations of the time series by enumeration, thus representing the time series as a set of pictures with different views and improving the clarity of the spatial representation of the dataset. It also addresses the issue of data strayness and imbalance by marking and prioritizing poorly trained data samples for learning. The model extensively improves the performance of convolutional neural networks in processing TSC.
Finally, this research compares the performance of the three algorithms across several prediction time windows in order to determine their efficiency. The results demonstrate that each of the three algorithms can accurately predict the trends of specific price movements. However, the improved RF method offers greater robustness for predicting the price change patterns of oil and steel. To achieve optimal performance for a certain dataset, we must develop a new deep learning model structure from scratch.
Compared with previous studies, this study is more systematic and not only considers the importance of construction materials in construction costs but also examines multiple prediction time windows for better application. This study transforms the price prediction problem of construction materials into a 3-category problem of rising, falling, and constant prices, making price prediction easier and more accurate yet equally effective. In addition, this study uses multiple models of deep learning and machine learning for comparative prediction and obtains more accurate prediction results, which can effectively estimate the market direction and effectively serve the construction industry to cope with capital and delivery risks.
Based on machine learning methods, this study estimates the future price trends of construction materials. The results of this study show that the machine learning model can accurately predict where the market is going, be used to plan construction, and help a business to manage its cash flow and finish projects.
Keywords: construction materials, price forecasting, improved random forest, convolutional neural networks, multi-pose marking learning, machine learning
|세계 경제의 하방 압력 하에서 건설 산업의 건전한 발전은 경제의 기둥 산업으로서 특히 중요하다. 건설 산업의 위험은 주로 안정적인 현금 흐름, 적시 배송 및 기술 노동력의 가용성이라는세 가지 측면에서 비롯된다. COVID-19의 유행은 세 가지 측면에서의 위험을 더욱 악화시킨다. 건설 자재의 가격 변동 추세를 정확하게 예측하는 것은 건설 기업의 자금 압박을 완화하고 배송 위험을 줄이며 노동 가용성을 향상시킴으로써 건설 산업이 COVID-19의 영향에 능동적으로 대응하는 데도 도움이 된다. 따라서 본 연구의 목적은 다양한 기계학습(Machine Learning) 알고리즘과 자기회귀 시퀀스(Auto-Regression Sequence)를 기반으로 중국에서의 건설자재 가격 변동 추이를 정확하게 예측하는데 있다.
본 연구에서는 먼저 시계열(Time Series) 데이터 세트의 생성 과정을 연구하고 다양한 기계학습 및 딥러닝(Deep Learning) 알고리즘을 사용하여 데이터 세트의 가용성을 검증하였다. 이를 기반으로 Improved Random Forest(RF) 알고리즘을 제안하였다. 이 알고리즘은 시계열의 특성과 깊이를 Random Forest 구성에 통합하고 시계열 분류 작업에 더 적합한 개선된 Random Forest 모형이다. 이 모형은 평균 94.62%의 예측 정확도(Accuracy)로 콘크리트, 강재 및 유가 변동 추이를 예측하는 데 좋은 성과를 보였다.
다음으로 본 연구에서는 Combined CNN-LSTM 모형을 제안하였다. 이 모형은 시간 시퀀스(Time Sequence)를 추출하기 위해 Convolutional Neural Network(CNN)을 사용하는 공간 규칙을 채택하고 Long Short-Term Memory Network(LSTM)를 사용하였다. 이 모형은 콘크리트 데이터 세트를 기반으로 하며 콘크리트 가격 변동 추세의 예측 정확도는 95.12%를 나타내었다.
또한CNN-LSTM 모형을 기반으로 Multi-Pose Marking 알고리즘을 제안하였다. 이 알고리즘을 통해 시계열 분류 작업을 처리하는 Convolutional Neural Network(CNN)의 성능을 향상시킬 수 있었다. 이 알고리즘은 열거 방법을 사용하여 시계열의 다양한 Pose 표현을 계산함으로써 시계열을 다양한 각도의 사진 그룹으로 표현하여 데이터 세트의 공간적 표현의 선명도를 향상시킨다. 그리고 잘 훈련되지 않은 데이터 샘플에 라벨을 붙이고 우선적으로 학습시킴으로써 데이터 샘플의 자유도와 불균형의 문제를 완화시킨다. 이 모형은 TSC(Time Series Classification)를 처리하는 Convolutional Neural Network(CNN)의 성능을 광범위하게 개선하게 하였다.
마지막으로 본 연구에서는 여러 예측시간창(Prediction Time Window)을 대상으로 제안된 세 가지 알고리즘의 예측 성능을 비교∙검증하였고 세 가지 알고리즘 모두 콘크리트 가격 변동의 추세를 잘 예측하였다. 그러나 석유와 철강의 가격 변동 추세 예측의 경우, Improved RF 알고리즘의 성능이 더 우수하였다. 특정 데이터 세트에 대해 딥 러닝 모형이 최상의 성능을 얻기 위해서는 새로운 딥 러닝 구조를 개발하여야 한다.
이전 연구와 비교하여 본 연구는 건설 비용에서의 건설 자재의 중요성을 고려할 뿐만 아니라 더 좋은 적용결과를 평가하기 위해 여러 예측시간창들을 대상으로 체계적으로 분석하였다는 것이다. 본 연구에서는 건축자재의 가격예측 문제를 가격 상승, 하락 및 유지의 3가지 분류 문제로 변환함으로써, 기존 연구와 비교하여 가격예측이 동등하게 효과적이면서 보다 쉽고 정확하게 예측한다는 데 있다. 또한, 본 연구에서는 성능 비교를 위해 딥러닝과 머신러닝의 여러 모형들을 사용하였으며, 보다 정확한 예측 결과를 얻을 수 있었다. 이는 시장 동향을 효과적으로 예측할 수 있음은 물론 건설 산업에 자금 및 인도 위험에 효과적으로 대응할 수 있게 할 것이다.
본 연구에서는 기계학습 알고리즘들을 기반으로 건설 자재의 가격 변동 추이 예측을 연구하였다. 연구 결과에 따르면 기계학습 모형은 건설시장 추세를 정확하게 예측하여 건축 계획의 기초를 제공하며 기업의 현금 흐름 관리 및 프로젝트를 완성하는데 도움을 줄 수 있을 것으로 기대된다.
Author(s)
LIU QING
Issued Date
2023
Awarded Date
2023-02
Type
Dissertation
Publisher
부경대학교
URI
https://repository.pknu.ac.kr:8443/handle/2021.oak/32952
http://pknu.dcollection.net/common/orgView/200000665898
Affiliation
부경대학교 기술경영전문대학원
Department
기술경영전문대학원 기술경영학과
Advisor
Woon-Seek Lee
Table Of Contents
Chapter 1 Introduction and Overview 1
1.1 Introduction 1
1.1.1 Research Background 1
1.1.2 Literature Review 3
1.1.3 Research Purpose 7
1.2 Dissertation Structure 9
1.2.1 Structure and Approach 9
1.2.2 Contribution of Each Chapter 10
Chapter 2 Data Acquisition and Datasets Creation 14
2.1 Introduction 14
2.2 Dataset Creation 16
2.2.1 Related Concepts 16
2.2.2 Dataset Description 17
2.2.3 Data Acquisition and Processing 18
2.3 Selection of Feature Length 20
2.4 Validity Verification 23
2.4.1 Validation with Convolutional Neural Networks 23
2.4.2 Verification of Long Short-Term Memory Networks 25
2.5 Conclusion 27
Chapter 3 An Improved RF Algorithm for Forecasting Concrete Price Trends 28
3.1 Introduction 28
3.2 Data and Methodology 30
3.2.1 Autoregressive Sequence 30
3.2.2 Dataset Description 31
3.2.3 Random Forest Model 32
3.2.4 Model Optimization 34
3.3 Empirical Research 37
3.3.1 Price Trends Forecast 38
3.3.2 Robustness Verification 42
3.4 Conclusion 46
Chapter 4 A Deep Learning Algorithm for Forecasting Concrete Price Trends 47
4.1 Introduction 47
4.2 Related Work 50
4.2.1 Autoregressive Series 50
4.2.2 Convolutional Neural Network 51
4.2.3 Long Short-Term Memory Network 52
4.3 Combined Model of CNN-LSTM 53
4.3.1 Graphical representation of time series 53
4.3.2 Convolutional Neural Network Architecture 56
4.3.3 LSTM Network Architecture 57
4.3.4 Neural Network Combination 57
4.4 Experiment 58
4.5 Conclusion and Outlook 60
Chapter 5 An Improved CNN Algorithm for TSC 62
5.1 Introduction 62
5.2 Multi-Pose Representation 65
5.2.1 Related Definitions 65
5.2.2 Multi-Pose Representation of Time Series Data 66
5.3 Marking Learning Algorithm 68
5.4 Experiments and Results 72
5.4.1 Experimental setup 72
5.4.2 Evaluation and Analysis 75
5.5 Conclusion and Outlook 83
Chapter 6 Construction Materials Price Trend Forecast with Multiple Time Windows 84
6.1 Introduction 84
6.2 Data and Experimental Settings 85
6.2.1 Data 85
6.2.2 Experimental Settings 87
6.3 Experiment 89
6.3.1 Forecasting of Concrete Price Trends 89
6.3.2 Forecasting of Steel Price Trends 92
6.3.3 Forecasting of Oil Price Trends 95
6.4 Conclusion 99
Chapter 7 Conclusions and Outlook 102
7.1 Conclusions 102
7.2 Limitations and Suggestions for the Future Researches 105
References 106
ACKNOWLEDGEMENTS 118
Degree
Doctor
Appears in Collections:
기술경영전문대학원 > 기술경영학과
Authorize & License
  • Authorize공개
  • Embargo2028-02-29
Files in This Item:
  • There are no files associated with this item.

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.