O processo para executar uma tarefa de MapReduce no

Propaganda
NOME DA TRANSCRIÇÃO:
Enviando uma tarefa MapReduce
PT-BR
1/1
O processo para executar uma tarefa de MapReduce no Hadoop consiste de 8
passos. O primeiro passo, o programa MapReduce que você escreve diz ao
JobClient para executar uma tarefa MapReduce.
Isso envia uma menssagem para o JobTracker que produz um identidade única
para a tarefa.
O JobClient copia os recursos da tarefa, tais como um arquivo tipo jar
contendo um código Java que você tenha escrito para implementar a tarefa de
mapeamento ou de redução, para o sistema de arquivos compartilhados que
usualmente é o HDFS.
Uma vez que os recursos estiverem no HDFS, o JobClient pode avisar o
JobTracker para iniciar a tarefa.
A JobTracker faz sua própria inicialização para a tarefa. Ele calcula como
dividir os dados para assim enviar cada pedaço “split” para um processo
diferente de mapper. Ele faz isso para maximizar o rendimento do processo.
Ele
recupera estes pedaços “input splits” do sistema de arquivos idosribuídos.
Já os TaskTrackers ficam continuamente enviando mensagens de movimentação
para
o JobTracker. Agora que o JobTracker tem trabalho para ele, ele retornará um
tarefa de mapeamento ou um tarefa de redução com um resposta à movimentação.
Os TaskTrackers precisam obter o código para executar, então ele o pegam no
sistema de arquivos distribuído.
Depois eles inicializam um máquina virtual Java com a execução de um
processo child nela e este processo executa seu código de mapeamento ou seu
código de redução.
Esta aula contínua no próximo vídeo.
Download