하둡 프로젝트를 하기 위해서는 기본적으로 알아야 할 내용 데이터와 관련되서 일련의
과정은 아래 와 같은 식으로 되어있다 즉 수집 ,저장, 관리, 처리 , 분석 , 표현을 하는 데이터와 관련된 일련의 과정으로 구성 되어있다.
생성 | 내부데이터 |
외부데이터 | |
수집 | 크롤링 |
ETL | |
(Extraction, Transformation, Loading) | |
저장 | NoSQL, 데이터베이스 |
스토리지 | |
관계형 데이터베이스 | |
관리 | 파티셔닝 |
메타스토어 | |
처리 | 맵리듀스 |
워크플로우 | |
실시간 이벤트 처리 | |
분석 | 마이닝 |
기계학습 | |
통계 | |
표현 | 가시화 |
'Hadoop Project ' 카테고리의 다른 글
네이버 데이터연구소 (0) | 2016.01.15 |
---|