하둡에 대한 짧은 생각::::걸작이 아닌 습작에 충실하자.

하둡에 대한 짧은 생각

Memo 2021. 10. 29. 14:54

하둡이라는 녀석의 개념이 워낙에 데이터의 '저장'과 밀접하다 보니,

이 녀석을 기존의 하드디스크에 데이터를 저장하는 방식과 안정성과 비교를 하게 된다.

하지만 하둡은 어디까지나 데이터의 분산 '처리'를 위해 만들어진 것으로,

안정적인 데이터 저장과는 목표가 사뭇 다르다.

하둡을 이용하면 용량이 큰 파일이더라도 여러 머신에 분산시킬 수 있다.

하드디스크가 데이터를 읽어 처리 장치에 넘기는 간격이 짧으니 데이터 처리 속도가 빠르다는 점과,

여러 머신에 분산시켜 버리니 병목 현상이 줄어든다는 점이 하둡의 엄청난 강점이다.

머신이 갖다 붙을수록 좋다.

말이 쉽지... 프로그래밍 좀 해본 사람들이라면 이게 얼마나 구현이 어려운 것인지 대충 짐작할 것이다..

그래서 이게 진짜 대단한 기술이다;;