Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Análise Exploratória de Dados: Exercícios e Explicações, Exercícios de Materiais

são exercicios propostos para praticar

Tipologia: Exercícios

2021

Compartilhado em 25/01/2023

Henrique69
Henrique69 🇧🇷

5

(1)

5 documentos

1 / 3

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Tarefa 2.2
1) O que é análise exploratória de dados?
A análise exploratória de dados é uma abordagem estatística empregada no
reconhecimento de regularidades e padrões de um conjunto de dados
multivariado para retirar as informações mais importantes, encontrando
tendências, agrupando conjuntos de acordo com similaridades e detectando
comportamentos anômalos.
2) Diferencie método da análise de componentes principais (PCA) e método da
análise hierárquica de agrupamentos (HCA).
O método de análise de componentes principais (PCA) é um método que utiliza
a projeção de dados multivariados e visa à transformação dos mesmos de
modo a reduzir sua dimensão e deixar mais evidentes as informações mais
relevantes.
a análise hierárquica de agrupamentos (HCA) é um método hierárquico
constituído por um arranjo de itens que são representados como estando
“acima”, “abaixo” ou “no mesmo nível” um do outro. A HCA é considerada um
método aglomerativo, pois considera cada objeto como um grupo unitário que
vai se unindo por similaridade a outros até chegar a um grupo mais amplo.
3) Defina e diferencie calibração univariada e calibração multivariada.
A calibração univariada é definida como o modelo mais simples de calibração,
para cada amostra de calibração, teremos apenas uma medida instrumental.
A calibração multivariada é definida como a análise de dados que permite o
estudo de sistemas com várias espécies presentes. Calibração pode ser
entendida como a relação quantitativa entre a resposta do aparelho e a
concentração do analito que se quer determinar, a disposição do conjunto de
dados é normalmente apresentada em forma de matriz, teremos as linhas
desta matriz que representa o conjunto das amostras e as colunas, que
representam o conjunto das variáveis medidas.
pf3

Pré-visualização parcial do texto

Baixe Análise Exploratória de Dados: Exercícios e Explicações e outras Exercícios em PDF para Materiais, somente na Docsity!

Tarefa 2.

  1. O que é análise exploratória de dados? A análise exploratória de dados é uma abordagem estatística empregada no reconhecimento de regularidades e padrões de um conjunto de dados multivariado para retirar as informações mais importantes, encontrando tendências, agrupando conjuntos de acordo com similaridades e detectando comportamentos anômalos.
  2. Diferencie método da análise de componentes principais (PCA) e método da análise hierárquica de agrupamentos (HCA). O método de análise de componentes principais (PCA) é um método que utiliza a projeção de dados multivariados e visa à transformação dos mesmos de modo a reduzir sua dimensão e deixar mais evidentes as informações mais relevantes. Já a análise hierárquica de agrupamentos (HCA) é um método hierárquico constituído por um arranjo de itens que são representados como estando “acima”, “abaixo” ou “no mesmo nível” um do outro. A HCA é considerada um método aglomerativo, pois considera cada objeto como um grupo unitário que vai se unindo por similaridade a outros até chegar a um grupo mais amplo.
  3. Defina e diferencie calibração univariada e calibração multivariada. A calibração univariada é definida como o modelo mais simples de calibração, para cada amostra de calibração, teremos apenas uma medida instrumental. A calibração multivariada é definida como a análise de dados que permite o estudo de sistemas com várias espécies presentes. Calibração pode ser entendida como a relação quantitativa entre a resposta do aparelho e a concentração do analito que se quer determinar, a disposição do conjunto de dados é normalmente apresentada em forma de matriz, teremos as linhas desta matriz que representa o conjunto das amostras e as colunas, que representam o conjunto das variáveis medidas.
  1. Explique o fundamento do método da regra dos K-vizinhos mais próximo (KNN). É o algoritmo de aprendizado com fundamentos em instâncias mais conhecido e com ampla utilização. Esse aprendizado é fundamentado na aplicação direta do conceito de similaridade. Isso significa dizer que, uma função de similaridade comunica ao algoritmo as quão próximas duas instâncias estão. Isso pode parecer simples, no entanto há uma enorme complexidade na escolha da função de similaridade, notadamente em situações que algumas das propriedades são peculiares.
  2. Defina o método SIMCA e enumere suas principais características. Este método foi utilizado pela primeira vez por Svante Wold (1974), no qual se admiti que os valores medidos para um grupo de amostras semelhantes tenderão para uma distribuição uniforme e modelável. Aumentando o número de amostras, essa distribuição deverá ficar cada vez mais uniforme. As características principais deste método são:
  1. Cada classe do conjunto de testes deve ser submetida a uma análise de componentes principais.
  2. Determinação do número de PCs necessário para descrição de cada classe.
  3. Construção de uma hipercaixa que envolve as amostras de cada classe, no qual as limitações das mesmas são definidas com um dado nível de confiança e uma vez obtidas as fronteiras de cada classe, faz-se a determinação se há superposição entre as mesmas.
  4. A capacidade de discriminação dos modelos SIMCA em diferenciar as classes é dada pela “distância entre classes” e pelos “resíduos entre classes”.
  5. A atribuição de uma amostra teste a uma determinada classe é fundamentada na projeção da mesma, no espaço dos escores e sua distância das fronteiras da classe em específico. Isto é repetido para todas as classes e no final, se os modelos não tiverem capacidade de discriminação suficiente, a amostra pode ser considerada membro de mais de uma classe. Pode ocorrer