RNN 학습에 필요한 데이터 분할

Programming/Extractions 2021. 1. 25. 16:55

0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11

위의 배열을 순서대로 4개씩 묶으면 3개로 분할 가능하다.

(0, 1, 2, 3) / (4, 5, 6, 7) / (8, 9, 10, 11)

시계열은 예측을 위하여 선행 데이터를 지표로 삼기 때문에 이런 식의 데이터 분할은 엄청난 낭비이며,

효과적으로 목표를 달성할 수 없기 때문에 데이터를 조밀하게 활용할 수 있도록 아래와 같이 중복을 허용하여 데이터를 분할하게 된다.

(0, 1, 2, 3)

(1, 2, 3, 4)

(2, 3, 4, 5)

...(중략)...

(7, 8, 9, 10)

(8, 9, 10, 11)

이렇게 되면 총 9개의 묶음으로 데이터가 분할된다. 

맨 끝에 진하게 표시된 숫자는 출력값으로 활용된다.

묶음들끼리의 순서는 중요하아서 섞여도 된다.

이 예시는 아주 기초적인 컨셉일 뿐이며, 응용이 다양할 것이다.

이상.

'Programming > Extractions' 카테고리의 다른 글

Call by Reference, Call by Value에 대한 고찰  (0) 2021.02.11
CNN 용어 정리  (0) 2021.01.28
써드 파티(3rd party) 개발자  (0) 2021.01.20
gRPC 정리  (0) 2021.01.09
객체와 인스턴스의 차이  (14) 2016.06.21
admin