Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Introdução ao Big Data e Hadoop, Slides de Sistemas de Gerenciamento do Banco de Dados (SGBD)

Curso de introdução à big data e Hadoop. Aborda conceitos bancos de dados e Big Data. Introduz ao ambiente Hadoop ensinando a utilizar o serviço de forma introdutória.

Tipologia: Slides

2021

Compartilhado em 29/06/2021

gustavo-caciolato-5
gustavo-caciolato-5 🇧🇷

1 documento

1 / 46

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Elissandro Amauri Sofiati
Arquiteto de Dados
Introdução ao Big
Data e Hadoop
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e

Pré-visualização parcial do texto

Baixe Introdução ao Big Data e Hadoop e outras Slides em PDF para Sistemas de Gerenciamento do Banco de Dados (SGBD), somente na Docsity!

Elissandro Amauri Sofiati Arquiteto de Dados

Introdução ao Big

Data e Hadoop

Mais sobre mim

● (^) Profissional de TI há mais de 20 anos ● (^) Sempre aprendendo ● (^) https://www.linkedin.com/in/easofiati ● (^) https://github.com/easofiati

Percurso

Aula

Big Data

Aula

Hadoop

[Nome do palestrante] [Posição]

[Nome do curso]

[Nome da aula]Aula 1: Big Data

Introdução ao Big Data

e Hadoop

[Nome do palestrante] [Posição]

[Nome do curso]

[Nome da aula]

Parte 1| Contexto atual de dados:

Big Data

Introdução ao Big Data e Hadoop

Contexto atual de dados

Atualmente temos dados sendo gerados a todo instante, sendo que a quantidade de dados está crescendo cada vez mais e ainda, são dados dos mais diversos tipos.

Contexto atual de dados

Como, onde e com que frequência esses dados são gerados?

Contexto atual de dados

Um exemplo de geração de dados. Quando você abre o browser, os seguintes dados são gerados:

  • (^) Conexão: IP, velocidade do seu link
  • (^) Geolocalização: Latitude, longitude, cidade, estado, país
  • (^) Software: browser, plugins, sistema operacional
  • (^) Hardware: cpu, gpu, nível de bateria
  • (^) Sites conectados: Google, Facebook, entre outros …

[Nome do palestrante] [Posição]

[Nome do curso]

[Nome da aula]

Parte 2| Estrutura e processamento dos

dados:

Big Data

Introdução ao Big Data e Hadoop

Estrutura e

processamento dos

dados

Cerca de 90% de todos os dados existentes, foram gerados nos últimos 4 anos e a maior parte desses dados são dados não estruturados.

Estrutura e

processamento dos

dados

Dados estruturados: são aqueles que possuem estruturas bem definidas, rígidas, a qual foi previamente planejada para armazená-los. Por exemplo: banco de dados, planilha de Excel, arquivo delimitado, arquivo posicional, entre outros.

Estrutura e

processamento dos

dados

Dados semiestruturados: não possuem estrutura totalmente rígida e nem estrutura totalmente flexível, sendo uma representação heterogênea entre estruturado e não estruturado. Por exemplo: JSON, XML, entre outros

Estrutura e

processamento dos

Outro conceito importante é o de processamento de dados, onde^ dados

temos o termo “real time” e “batch”.

[Nome do palestrante] [Posição]

[Nome do curso]

[Nome da aula]

Parte 3| Definição de Big Data:

Big Data

Introdução ao Big Data e Hadoop