Curso de Big Data usando Hadoop Advanced - Cursos presenciais, online Ao Vivo e EAD

Objetivo do Curso Big Data usando Hadoop Advanced:

O objetivo do treinamento é conduzir o participante para que possa implementar e configurar um Hadoop cluster.

Hadoop é um projeto Apache de código aberto que permite a criação de aplicativos de processamento paralelo em grandes conjuntos de dados, distribuídos em nós em rede. É composto pelo Hadoop Distributed File System (HDFS), que lida com escalabilidade e redundância de dados entre os nomes;

Nesse treinamento, o ecossistema Hadoop é configurado a partir de sua parte central (Hadoop Core) composto pelo:

- Hadoop YARN, é uma estrutura para agendamento de trabalho que executa tarefas de processamento de dados em todos os nós.

- Nodemaster, mantém conhecimento sobre o sistema de arquivos distribuído, como a tabela inode em um sistema de arquivos ext3, e programa a alocação de recursos.

- NameNode gerencia o sistema de arquivos distribuído e sabe onde estão os blocos de dados armazenados dentro do cluster.

- O ResourceManager gerencia os trabalhos YARN e cuida do agendamento e execução de processos

- DataNode gerencia os dados físicos armazenados no node; é nomeado, NameNode.

- NodeManager gerencia a execução de tarefas no node

Além disso, o participante instala, configura e cria aplicações a partir das principais ferramentas que fazem parte do ecossistema Hadoop:

Hive

Spark

Pig

Hbase

Turnos

CONSULTE-NOS
Duração

32 horas
Formatos

Presencial

Online ao Vivo
Apostila Digital

Idioma: Português

Sujeito a alteração sem aviso prévio

Você sabe a diferença entre os cursos online e os cursos a distância?

No Curso online você tem aulas digitais e interage com mentores reais ao vivo. Já no Curso a distância, tanto o conteúdo, quanto a interação são digitais.

Pedir informações

Conteúdo Programático:

Módulo 1 - Visão geral da arquitetura Hadoop

Camadas da arquitetura Hadoop

Módulo 2 ? HDFS

NameNode

NameNode Secundário

Standby NameNode

Zookeeper

DataNode

Rack Aware

YARN

Resource Manager

NodeManager

Recipientes (Container)

NodeMaster/Application Master

JobHistory Server

Como funciona o YARN?

MapReduce

Fase do Mapa(Map)

Fase de embaralhamento e classificação

Fase de redução (reduce)

Módulo 3 - Instalação Cluster

Criando o novo usuário Hadoop

Módulo 4 - Instalando o Hadoop no Ubuntu

Implantação de Hadoop - modo pseudo-distribuído

Namenode e Datanode

Formatar o HDFS NameNode

Módulo 5 - Iniciar Hadoop Cluster

Hadoop no navegador

Módulo 6 - Apache Hive Hadoop Cluster

Instalando o Apache Hive

Criar Banco de Dados

Carregar Dados

Particionamento no Hive

Particionamento Estático

Módulo 7 - Spark Hadoop Cluster

Recursos do Apache Spark

Arquitetura Spark

Instalando Spark

configurar o Spark

Test Spark Shell

Teste Python no Spark

Comandos básicos

Função Spark Map

Word Count - contagem de palavras do Spark

Módulo 8 - Apache Pig Hadoop Cluster

Instalação do Apache Pig

Modos de execução no Apache Pig:

Declarações Pig Latin

Módulo 9 - Hbase - modo de instalação pseudo-distribuído

Comandos do shell HBase

Comandos gerais

Comandos de gerenciamento de tabelas

Comandos de manipulação de dados

Comandos de replicação de cluster

Cursos Relacionados

PLANO MASTERTECH

SAP S4/HANA, FUNCIONAL, FIORI, BASIS, ABAP

ITIL, COBIT, NEGÓCIOS, BPM, BPMN, LGPD, DPO

DEV, PYTHON, FRONT END, FULL, JAVA

POWER BI, BIG DATA, DATA SCIENCE

CEH, CYBER SECURITY, CISSP

MICROSOFT OFFICE

MARKETING DIGITAL, E-COMMERCE

INTELIGÊNCIA ARTIFICIAL, CHATGPT, AUTOMAÇÕES

PMI PMP, PROJETOS, SCRUM

ORACLE, MICROSOFT SQL

CISCO, CCNA, AWS, VMWARE

CERTIFICAÇÃO MICROSOFT, AZURE, SERVER

Curso Big Data usando Hadoop Advanced

Objetivo do Curso Big Data usando Hadoop Advanced:

Você sabe a diferença entre os cursos online e os cursos a distância?

Conteúdo Programático:

Pré-Requisito:

Cursos Relacionados

Business Intelligence usando o Microsoft Power BI - Analyzing Data with Power BI - MS - PL-300 (Power BI)

Formação Cientista de Dados com Big Data - Data Science & Analytics - Python Foundation + Python Aplicado a Big Data + Big Data Hadoop + Business Intelligence usando o Microsoft Power BI

Big Data Hadoop - Processando dados com Hadoop HortonWorks (HDP)

Assinatura MasterTech: 12 Meses de Acesso a Todos os Cursos Presenciais e Online ao Vivo

Programando usando Python

Por que realizar seu curso na Trainning?

Quer saber mais? Cadastre-se!

Receba uma proposta para sua empresa:

Big Data usando Hadoop Advanced

Solicitação enviada com sucesso!

Curso Big Data usando Hadoop Advanced

Objetivo do Curso Big Data usando Hadoop Advanced:

Você sabe a diferença entre os cursos online e os cursos a distância?

Conteúdo Programático:

Pré-Requisito:

Cursos Relacionados

Business Intelligence usando o Microsoft Power BI - Analyzing Data with Power BI - MS - PL-300 (Power BI)

Formação Cientista de Dados com Big Data - Data Science & Analytics - Python Foundation + Python Aplicado a Big Data + Big Data Hadoop + Business Intelligence usando o Microsoft Power BI

Big Data Hadoop - Processando dados com Hadoop HortonWorks (HDP)

Assinatura MasterTech: 12 Meses de Acesso a Todos os Cursos Presenciais e Online ao Vivo

Programando usando Python

Por que realizar seu curso na Trainning?

Quer saber mais? Cadastre-se!