출처 : https://ieeexplore.ieee.org/document/10756980
Q. Vo, P. Ea, S. Benzouaoua, O. Salem, and A. Mehaoua, “Anomaly Detection in IoT Sensor Energy Consumption Using LSTM Neural Networks and Isolation Forest,”
- 서론
: 본 연구는 IoT 센서를 통해 수집된 에너지 소비량의 이상치를 측정하고 미래의 소비를 예측하기 위한 모델을 고안하기 위해 LSTM 모델과 Isolation Forest 모델을 사용했다. IoT는 정보화 시대에서 차지하고 있는 비중이 큰 만큼 이를 올바르게 유지 보수 하는 것은 필수적인 과제이다. 특히 의료 시스템에서 IoT 기술은 환자의 생사를 결정할 수도 있을 만큼 중요한 문제이다. 이 때 적절하게 에너지가 공급되지 않거나 누수/누전이 발생한다면 심각한 문제를 초래할 수 있다. 특히 위 연구는 사이버 공격 상황에서의 이상치를 중심으로 실험을 진행했다. 왜냐하면 IoT 센서를 대상으로 한 사이버 공격에 관한 연구는 드물기 때문이었다.
2. 실험 내용 및 결과
: 에너지 사용량 예측과 이상치 탐지를 위해 머신러닝과 딥러닝 모델을 혼용했다. 먼저 예측 작업에서 LSTM(Long Short-Term Memory), Decision Tree, Linear Regression 모델이 사용되었고, 이상치 탐지에서는 Isolation Forest, One-Class SVM, Elliptic Envelope, Local Outlier Factor 총 네 가지의 모델이 사용되었다. 위 세 가지, 네 가지 모델을 조합하여 총 12번의 실험을 진행하였다. 관련 선행 연구에서도 유사하게 IF, CNN, LSTM, Bi-LSTM 등의 모델을 사용해서 97 ~ 99%의 정확도를 보인 바 있다.
: 결과적으로 성능이 가장 좋았던 모델에 대해서만 간략히 짚고 넘어가자면 LSTM은 시계열 예측에 유리하도록 개선된 RNN 모델의 일종이다. LSTM은 Memory cell을 자체적으로 보유하고 있어 장기 기억을 보유하기 어려운 RNN모델의 단점을 보완한다. LSTM 모델에서는 입력 단계, 망각 단계, 출력 단계로 이루어져 있다. 망각 단계에서 필요한 정보를 제외하고 망각한 뒤 출력해 이를 Memory cell에 저장하는 방식이다. Isolation Forest 모델은 이상치 탐지 작업에서 가장 흔하게 쓰이는 모델 중 하나로 이상치는 일반 데이터들에 비해 빨리 고립된다는 점에 기반하고 있다. 데이터셋에서 특징을 랜덤으로 추출한 뒤 해당 특성에서 임의의 수치로 분할한다. 이 과정을 통해 각각의 value에 Isolation score를 부여한다. 최종적으로 점수가 가장 높은 수치가 이상치로 판단된다.
: 실험은 총 다섯 개의 IoT 센서에서 수집된 데이터로 진행되었다. 또한 사이버 공격의 경우는 Dos, DDoS, Brute Force, Exploitation, MiTM, Data, Breach, Firmware, Ransomware의 경우를 설정하고 진행이 되었다. 성능 평가 방식은 기본적인 Confusion Matrix와 AUC score이 사용되었다.
다음의 표에서 볼 수 있듯이 LSTM과 IF 모델의 조합에서 가장 높은 성능을 보였다.
다음 ROC curve에서도 결과를 확인할 수 있다.
3. 결론
: 본 연구에서는 IoT 센서를 통해 수집된 데이터셋에서 예측 작업과 이상치 관측을 수행하기 위해 12가지의 모델 조합을 실험했다. 먼저 모델링의 측면에서는 개인적으로 저번학기 수업에서 Isolation Forest 모델로 이상치 관측을 해본 적이 있는데 더 자세히 알 수 있어서 좋았다. 또한 선행 연구들을 개별적으로도 조사하면서 예측 모델에서 LSTM이 자주 쓰이는 것을 보아서 잘 알아두면 좋을 것 같다고 생각했다. 연구의 필요성 부분에서는 이상치 탐지의 중요성에 대해서 새로운 인사이트를 얻을 수 있었다. 연구 방법에서도 에너지 누수를 사이버 공격에 한정시켜서 분석한 점도 특이했다.
'Miscellaneous' 카테고리의 다른 글
[2025-1] 정지우 - Q-learning (심화편) [혁펜하임 강화학습 4-2강 정리] (0) | 2025.01.12 |
---|---|
n-step TD vs n-step Q-learning (0) | 2025.01.12 |
[2025-1] 염제원 - SELF-RAG: Self-Reflective Retrieval-Augmented Generation (0) | 2025.01.08 |
[2025-1] 정지우 - Optimal policy 쉬운 설명 (혁펜하임 강화학습 3-1강 정리) (0) | 2025.01.04 |
[2024-1] 김동한 - A Short Introduction to Boosting (0) | 2024.05.21 |