IT/Big Data, Machine Learning1 Hadoop vs Spark 및 Big Data Tool 에 대해 자세한 설명 Hadoop vs Spark 및 Big Data Tool 에 대해 자세하게 정리한 글 로 Big Data 및 관련툴 Hadoop;Hadoop은 Apache open source project으로 생겨난 HDFS (Hadoop Data File System) 을 사용해 Data를 무한대의 시스템에 분산시켜 저장하고 MapReduce 툴을 사용해 Data를 Parallel and Distributed 하게 처리할수 있는 framework 로 오픈 소스 프로젝트이니 무료 소프트웨어 입니다. Hadoop의 특징은 데이터를 Disk/storage에 저장하기 때문에 빅데이터 분석 language (R, Python 등)를 통해 분석시 time에 민감하지 않은, 예로 MapReduce 툴을 사용한 배치잡을 통한 데이.. 2018. 11. 25. 이전 1 다음