[O’Reilly Media] Hadoop Fundamentals for Data Scientists Training Video [2015, ENG]

Виртуальная машина:

https://www.dropbox.com/s/eg80qsitun7txu1/hfpd3.vmdk.gz?dl=0


user: student
password: password


Альтернативно, можно поискать Cloudera CDH5 или Hortonworks Sandbox

В файле ~/.bash_aliases алиасы на некоторые команды.



https://github.com/bbengfort/hadoop-fundamentals



Создание виртуальной машины virtual box для курса по hadoop

Working with Hadoop via the Command Line: Starting HDFS and Yarn

Working with Hadoop via the Command Line: Loading Data into HDFS

Working with Hadoop via the Command Line: Running a MapReduce Job

Дальше поплыл. Пока нужно разобраться как настраивать самостоятельно в single и cluster конфигурациях.