반응형
12. Ch01. 시계열 알고리즘 딥러닝 시계열 - 04. 시계열과 딥러닝 알고리즘 비교
13. Ch01. 시계열 알고리즘 딥러닝 시계열 - 05. 시계열분석에 딥러닝이 필요한 이유
14. Ch01. 시계열 알고리즘 딥러닝 시계열 - 06. 시계열딥러닝 알고리즘1-1(CNN vs RNN)
1. 시계열 회귀 분석과 딥러닝의 차이
일반적인 다중회귀식은 다음 그림에 나와있다.
이를 네트워크로 표현하면 아래 노드와 엣지와 같이 나타나는데, 이에 활성함수를 취해준 모습으로 인공신경망(딥러닝)처럼 표현할 수 있다.
1-1. 인공신경망 식과 구조
위 표현식을 간단하게 표현하면 아래 그림과 같은데, 각 노드와 가중치가 반복적으로 곱해지고 더해지며 predicted Y를 구하는 것이다.
1-2. 인공신경망의 검증(Evaluation)
- 인공신경망은 입력과 출력이 직접적으로 연결되지 않기 때문에 비선형성을 포함하며, 구성된 층만큼 더 다양한 패턴을 학습(회귀)할 수 있다. 그만큼 회귀모델보다 나은 성능을 보이지만 설명 가능 정도는 그만큼 떨어진다.(어느 층에서 어떻게 영향을 주는지 추측하기 어렵다; Black box)
- 모델을 적당하게 구성하고, 최적의 하이퍼 파라미터를 찾는 것 또한 딥러닝의 주요한 과제이다.
2. 시계열 분석에서 딥러닝이 필요한 이유
2-1. 머신러닝 방향 및 발전
2-2. 시계열 분석에 딥러닝 적용 필요성
1) 자동 Feature 추출과 학습
- 기존에는 사람이 손수 생성
- 그에 따라 많은 손실과 오류가 반영될 가능성
- 사람의 영향을 최소화하고 여러층을 적용해 새로운 Feature를 추출해야 한다.
2) 다양한 입출력 작업을 가능하게 함
- 기존의 머신러닝 방법도 다양한 입출력을 사용할 수는 있지만 알고리즘에 따라 달라지고 한계가 존재.
- 그보다 딥러닝에서는 입출력에 따라 딥러닝 구조를 바꿔 여러 경우에 대처 가능하게 됨.
3) 길이가 긴 Sequence 패턴 추출 가능
2-2. 알고리즘의 한계 : Garbage in, garbage out(GIGO)
- 대부분의 연구가 알고리즘 설명과 성능에만 집중하고, 어떻게 분석했는지에 대해서는 상대적 경시.
- 이를 실제 사례에 적용, 분석해보면 결과가 안 좋은 경우도 많다.(머신러닝 기법보다도)
가장 중요한 것은 데이터이다. 데이터의 질이 쓰레기라면 좋은 알고리즘의 출력이라도 쓰레기이기 때문이다.
3. 시계열 딥러닝(Supervised Learning)
3-1. CNN 과 RNN
- CNN : 이미지처럼 여러 값이 격자의 형태로 구성된 데이터를 처리하는데 특화됨.
- 이미지나 영상 인식, 분류 문제 등에서 뛰어난 결과
- RNN : 순서가 있는 데이터를 처리하는데 특화된 모델
- 은닉층 노드를 공통으로 사용하여 이전 상태를 반영한 가중치 갱신이 가장 큰 특징.(그림 우측)
강의 소개 링크 : https://bit.ly/3czfg42
반응형
'Python > 시계열 데이터 분석' 카테고리의 다른 글
[시계열 분석] 과소적합/과적합/편향/분산 (0) | 2021.03.07 |
---|---|
[시계열 분석] 시계열 회귀분석 레퍼런스 모델 적용, 검증지표 개념 및 이해 (0) | 2021.03.03 |
[시계열 분석] 시계열 데이터 패턴의 추출 실습(2), 시계열과 비시계열 훈련, 검증, 실험 (0) | 2021.02.28 |
[시계열 분석] 시계열 데이터 패턴의 추출 실습(1) (1) | 2021.02.24 |
[시계열 분석] 추세 , 계절성, 주기, 더미변수 활용, 지연값 (0) | 2021.02.16 |
댓글