하둡 프로젝트를 하기 위해서는 기본적으로 알아야 할 내용 데이터와 관련되서 일련의 

과정은  아래 와 같은 식으로 되어있다 즉  수집 ,저장, 관리, 처리 , 분석 , 표현을 하는 데이터와 관련된 일련의 과정으로 구성 되어있다. 

생성

내부데이터

외부데이터

수집

크롤링

ETL

(Extraction, Transformation, Loading)

저장

NoSQL, 데이터베이스

스토리지

관계형 데이터베이스

관리

파티셔닝

메타스토어

처리

맵리듀스

워크플로우

실시간 이벤트 처리

분석

마이닝

기계학습

통계

표현

가시화


'Hadoop Project ' 카테고리의 다른 글

네이버 데이터연구소  (0) 2016.01.15
Posted by 이상욱1
,