[O’Reilly Media] Hadoop Fundamentals for Data Scientists Training Video [2015, ENG]
Виртуальная машина:
https://www.dropbox.com/s/eg80qsitun7txu1/hfpd3.vmdk.gz?dl=0
user: student
password: password
Альтернативно, можно поискать Cloudera CDH5 или Hortonworks Sandbox
В файле ~/.bash_aliases
алиасы на некоторые команды.
https://github.com/bbengfort/hadoop-fundamentals
Создание виртуальной машины virtual box для курса по hadoop
Working with Hadoop via the Command Line: Starting HDFS and Yarn
Working with Hadoop via the Command Line: Loading Data into HDFS
Working with Hadoop via the Command Line: Running a MapReduce Job
Дальше поплыл. Пока нужно разобраться как настраивать самостоятельно в single и cluster конфигурациях.