RNN 학습에 필요한 데이터 분할
Programming/Extractions
2021. 1. 25. 16:55
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 위의 배열을 순서대로 4개씩 묶으면 3개로 분할 가능하다. (0, 1, 2, 3) / (4, 5, 6, 7) / (8, 9, 10, 11) 시계열은 예측을 위하여 선행 데이터를 지표로 삼기 때문에 이런 식의 데이터 분할은 엄청난 낭비이며, 효과적으로 목표를 달성할 수 없기 때문에 데이터를 조밀하게 활용할 수 있도록 아래와 같이 중복을 허용하여 데이터를 분할하게 된다. (0, 1, 2, 3) (1, 2, 3, 4) (2, 3, 4, 5) ...(중략)... (7, 8, 9, 10) (8, 9, 10, 11) 이렇게 되면 총 9개의 묶음으로 데이터가 분할된다. 맨 끝에 진하게 표시된 숫자는 출력값으로 활용된다. 묶음들끼리의..