Inscreva-se
X

Não vá embora!

até 12x sem juros

até 12x sem juros no cartão

INFORMAÇÕES Inscreva-se agora!
5 (20)votos

Curso Big Data usando Hadoop Advanced


Carga horária: 32 horas

Quero receber informações + Cupom 10% Desconto

Big Data usando Hadoop Advanced

Objetivo do Curso Big Data usando Hadoop Advanced:

O objetivo do treinamento é conduzir o participante para que possa implementar e configurar um Hadoop cluster.
 
 Hadoop é um projeto Apache de código aberto que permite a criação de aplicativos de processamento paralelo em grandes conjuntos de dados, distribuídos em nós em rede.  É composto pelo Hadoop Distributed File System (HDFS), que lida com escalabilidade e redundância de dados entre os nomes;
Nesse treinamento, o ecossistema Hadoop é configurado a partir de sua parte central (Hadoop Core) composto pelo:
 - Hadoop YARN, é uma estrutura para agendamento de trabalho que executa tarefas de processamento de dados em todos os nós.
 
 - Nodemaster, mantém conhecimento sobre o sistema de arquivos distribuído, como a tabela inode em um sistema de arquivos ext3, e programa a alocação de recursos.
 
 - NameNode gerencia o sistema de arquivos distribuído e sabe onde estão os blocos de dados armazenados dentro do cluster.
 
 - O ResourceManager gerencia os trabalhos YARN e cuida do agendamento e execução de processos
 
  - DataNode gerencia os dados físicos armazenados no node; é nomeado, NameNode.
 
 -  NodeManager gerencia a execução de tarefas no node
 
Além disso, o participante instala, configura e cria aplicações a partir das principais ferramentas que fazem parte do ecossistema Hadoop:
     Hive
     Spark
     Pig
     Hbase

Você sabe a diferença entre os cursos online e os cursos a distância?

No Curso online você tem aulas digitais e interage com mentores reais ao vivo. Já no Curso a distância, tanto o conteúdo, quanto a interação são digitais.

Pedir informações

Conteúdo Programático:

Módulo 1 - Visão geral da arquitetura Hadoop

Camadas da arquitetura Hadoop

 

Módulo 2 ? HDFS

NameNode

NameNode Secundário

Standby NameNode     

Zookeeper        

DataNode

Rack Aware

YARN

Resource Manager

NodeManager

Recipientes (Container)

NodeMaster/Application Master

JobHistory Server

Como funciona o YARN?

MapReduce

Fase do Mapa(Map)

Fase de embaralhamento e classificação

Fase de redução (reduce)

 

Módulo 3 - Instalação Cluster

Criando o novo usuário Hadoop

 

Módulo 4 - Instalando o Hadoop no Ubuntu

Implantação de Hadoop - modo pseudo-distribuído

Namenode e Datanode

Formatar o HDFS NameNode

 

Módulo 5 - Iniciar Hadoop Cluster

Hadoop no navegador

 

Módulo 6 - Apache Hive Hadoop Cluster

 

Instalando o Apache Hive

Criar Banco de Dados

Carregar Dados

Particionamento no Hive

Particionamento Estático

 

Módulo 7 - Spark Hadoop Cluster

Recursos do Apache Spark

Arquitetura Spark

Instalando Spark

configurar o Spark

Test Spark Shell

Teste Python no Spark

Comandos básicos

Função Spark Map

Word Count - contagem de palavras do Spark

 

Módulo 8 - Apache Pig Hadoop Cluster

Instalação do Apache Pig

Modos de execução no Apache Pig:

Declarações Pig Latin

 

Módulo 9 - Hbase - modo de instalação pseudo-distribuído

Comandos do shell HBase

Comandos gerais

Comandos de gerenciamento de tabelas

Comandos de manipulação de dados    

Comandos de replicação de cluster

 

 

 

Pré-Requisito:

O participante deve ter realizado o treinamento Big Data Hadoop HDP ? Hortonworks Data Platform. Possuir conhecimento em Banco de dados.

Cursos Relacionados


Por que realizar seu curso na Trainning?

+ 300.000 alunos treinados e milhares de alunos certificados em 12 anos

+ 12 premiações nacionais e internacionais como melhor centro de treinamentos do Brasil

+ 200 cursos presenciais e remotos nas áreas de tecnologia, gorvernança e negócios

+ 300 instrutores que fazem parte do maior corpo docente de tecnologia de negócios do Brasil

Quer saber mais? Cadastre-se!

Política de privacidade