






















































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Este documento fornece exemplos de análise estatística descritiva e criação de gráficos utilizando o software r, abordando conceitos como variância amostral, desvio padrão, distribuição de frequência, testes de hipóteses e matrizes de gráficos. Além disso, são apresentados exemplos de leitura e manipulação de arquivos csv.
Tipologia: Resumos
1 / 62
Esta página não é visível na pré-visualização
Não perca as partes importantes!























































Enivaldo Rocha
Enivaldo Rocha
Enivaldo Rocha
Enivaldo Rocha
Enivaldo Rocha
Enivaldo Rocha
notas <- read.csv("notas.csv", sep=";", dec=",",header=TRUE)
Ordenação das Notas
sort(notas$notas) 1_._ 52_._ 52_._ 52_._ 53_._ 03_._ 03_._ 03_._ 03_._ 53_._ 53_._ 53_._ 53_._ 54_._ 04_._ 04_._ 04_._ 04_._ 04_._ 04_._ 54_._ 54_._ 54_._ 5 4.5 4.5 5.0 5.0 5.0 5.0 5.0 5.0 5.0 5.0 5.0 5.5 5.5 5.5 5.5 5.5 5.5 5.5 5.5 5.5 5.5 5.5 6. 6.0 6.0 6.0 6.0 6.0 6.0 6.0 6.0 6.0 6.0 6.0 6.0 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6. 7.0 7.0 7.0 7.0 7.0 7.0 7.5 7.5 7.5 7.5 7.5 7.5 7.5 7.5 7.5 7.5 8.0 8.0 8.0 8.0 8.0 8.0 8. 8.5 8.5 9.0 9.0 9.5 10.0 10.0 10.
Classes Frequência Porcentagem [1,2) 1 1% [2,3) 3 3% [4,5) 12 12% [5,6) 20 20% [6,7) 24 24% [7,8) 16 16% [8,9) 9 9% [9,10) 6 6% Total 100 100%
Enivaldo Rocha
hist(notas$notas, main="Histograma da variável Notas",prob=T, xlab="Notas", ylab="Densidade")
Histograma da variável Notas
Densidade
2 4 6 8 10
Enivaldo Rocha
Exemplo 1 - Considere as notas da disciplina análise de dados e verifique se tem algum outlier presente na distribuição.
5
10
15
20
Boxplot de salários
Salários
Enivaldo Rocha
Dados: Bussab
m <- read.csv("milsa.csv", sep=";", dec=",",header=TRUE)
O R possui uma enorme capacidade para gerar diversos tipos de
gráficos de alta qualidade totalmente configuráveis, desde cores e
tipos de linhas, até legendas e textos adicionais.
Opções :// xlim: (inicio,fim) dupla contendo os limites do eixo X.
ylim: (inicio,fim) dupla contendo os limites do eixo Y.
xlab: rótulo para o eixo X.
ylab: rótulo para o eixo Y.
main: título principal do gráfico.
col: cor de preenchimento do gráfico, podendo ser um vetor. A
lista das cores disponíveis pode ser obtida através do comando
colors().
Enivaldo Rocha Histograma
Notas na disciplina análise de dados
Comando : hist(dados, opções) opções: prob: T plota a densidade. F plota a freqüência absoluta. breaks: vetor contendo os pontos de definição das larguras das barra do histograma.
notas <- read.csv("notas.csv", sep=";", dec=",",header=TRUE) head(notas) hist(notas$notas, main="Histograma da variável Notas", prob=T, xlab="Notas", ylab="Densidade", col=c("orange"), ylim=c(0,0.3), col.main="darkgray")
Histograma da variável Notas
Notas
Densidade
2 4 6 8 10
0.^ 0.^
Enivaldo Rocha BoxPlot
Boxplot - Dados Bussab
Comando : boxplot(dados, opções) opções: outline: T plota os outliers.
boxplot(m$salario, xlab="Boxplot de Salários", ylab="Salários", col="green") boxplot(m$salario ˜. m$educacao, xlab="Boxplot de salários", ylab="Salários", col=c("yellow","orange","red"))
5
10
15
20
Boxplot de salários
Salários
1o Grau 2o Grau Superior
5
10
15
20
Boxplot de salários
Salários
Enivaldo Rocha
Tipos de câncer
par(mfrow=c(2,2)) plot(ca[,1], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Câncer de Mama", col="pink") plot(ca[,2], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Câncer de Pele", col="green") plot(ca[,3], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Câncer de Próstata", col="red") plot(ca[,4], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Linfoma", col="blue")
Mortalidade no Brasil por Câncer de Mama
Time
Taxa de mortalidade (por 100000)
1980 1985 1990 1995 2000 2005 2010 2015
0.^
Mortalidade no Brasil por Câncer de Pele
Time
Taxa de mortalidade (por 100000)
1980 1985 1990 1995 2000 2005 2010 2015
0.^ 0.^ 0.^ 0.^ 0.^ 0.^
Mortalidade no Brasil por Câncer de Próstata
Taxa de mortalidade (por 100000)
1980 1985 1990 1995 2000 2005 2010 2015
4
6
8
10
12
14
Mortalidade no Brasil por Linfoma
Taxa de mortalidade (por 100000)
1980 1985 1990 1995 2000 2005 2010 2015
0.^
Enivaldo Rocha
Tipos de câncer
par(mfrow=c(2,2)) plot(ca[,1], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Câncer de Mama", col="pink",ylim=c(0,15)) plot(ca[,2], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Câncer de Pele", col="green",ylim=c(0,15)) plot(ca[,3], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Câncer de Próstata", col="red",ylim=c(0,15)) plot(ca[,4], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Linfoma", col="blue", ylim=c(0,15))
Mortalidade no Brasil por Câncer de Mama
Time
Taxa de mortalidade (por 100000)
1980 1985 1990 1995 2000 2005 2010 2015
0
5
10
15
Mortalidade no Brasil por Câncer de Pele
Time
Taxa de mortalidade (por 100000)
1980 1985 1990 1995 2000 2005 2010 2015
0
5
10
15
Mortalidade no Brasil por Câncer de Próstata
Time
Taxa de mortalidade (por 100000)
1980 1985 1990 1995 2000 2005 2010 2015
0
5
10
15
Mortalidade no Brasil por Linfoma
Time
Taxa de mortalidade (por 100000)
1980 1985 1990 1995 2000 2005 2010 2015
0
5
10
15