Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Análise Estatística de Salários e População por Nível de Instrução e Localização, Exercícios de Estatística

Um análise estatística de dados de salários e população por nível de instrução e localização rural ou urbana. O autor utiliza o r para ler e manipular os dados, calculando médias, mediana e moda de salários por nível de instrução. Além disso, ele compara as médias salariais entre os graus de instrução e conclui que pessoas com níveis de instrução mais elevados tendem a ter salários mais elevados. O documento também inclui gráficos de dispersão, histogramas e pie charts para ilustrar as conclusões.

Tipologia: Exercícios

2021

Compartilhado em 28/07/2021

silas-gomes
silas-gomes 🇧🇷

1 documento

1 / 10

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
UNIVERSIDADE FEDERAL DE OURO PRETO
INSTITUTO DE CIÊNCIAS EXATAS E APLICADAS
JOÃO MONLEVADE
LORENA SOARES DE OLIVEIRA BRAGA
20.1.8052
LISTA 1
ESTATÍSTICA E PROBABILIDADE MARCOS GOULART
JOAO MONLEVADE, 2021
pf3
pf4
pf5
pf8
pf9
pfa

Pré-visualização parcial do texto

Baixe Análise Estatística de Salários e População por Nível de Instrução e Localização e outras Exercícios em PDF para Estatística, somente na Docsity!

UNIVERSIDADE FEDERAL DE OURO PRETO

INSTITUTO DE CIÊNCIAS EXATAS E APLICADAS

JOÃO MONLEVADE

LORENA SOARES DE OLIVEIRA BRAGA

LISTA 1

ESTATÍSTICA E PROBABILIDADE – MARCOS GOULART

JOAO MONLEVADE, 202 1

Questão 1 Letra A

library(readxl) tab <- read_excel("C:/Users/loren/Downloads/tab.xlsx",

  • col_types = c("numeric", "text", "text",
  • "numeric", "numeric", "numeric",
  • "numeric", "numeric")) There were 50 or more warnings (use warnings() to see the first 50)

View(tab) summary(tab$salario) Min. 1st Qu. Median Mean 3rd Qu. Max. 4.000 7.553 10.165 11.122 14.060 23. summary(tab$idade_anos) Min. 1st Qu. Median Mean 3rd Qu. Max. 20.00 30.00 34.50 34.58 40.00 48. summary(tab$n_filhos) Min. 1st Qu. Median Mean 3rd Qu. Max. NA's 0.00 1.00 2.00 1.65 2.00 5.00 16 boxplot(tab$salario,tab$idade_anos,tab$n_filhos) 1= Legenda: 1= Salário 2= Idade anos 3= Número de filhos

MM <- getmode(M) print(MM) [1] 5. getmode <- function(s){

  • uniqv <- unique(s)
  • uniqv[which.max(tabulate(match(s, uniqv)))]
  • }

s <- (x$superior) ms <- getmode(s) print(ms) [1] 10.

Após fazer a divisão da tabela importada anteriormente pelo grau de instrução e salário utilizando o comando split, calculei a média, mediana e moda. Letra C Analisando os dados da tabela e fazendo a comparação das médias salariais entre os graus de instrução é possível concluir que pessoas com um nível de escolaridade maior vão consequentemente ter um salário maior, onde o grau de instrução é diretamente proporcional ao salário. Legenda: População Rural É possível concluir pelo gráfico a maioria das famílias de população rural possuem salário de até R$ 1 908,00.

Legenda: População Urbana É possível concluir que a maioria das famílias da população urbana recebem salário de mais de R$ 2862,00 a R$ 5724,00. Legenda: População Total Foi possível observar que a população urbana tem uma influência maior que a população rural, ou seja, como foi mostrado no gráfico da população urbana, a maioria das famílias recebem um salário superior a R$ 2862,00 até 5724,00.

Como os histogramas são gráficos de barras, onde suas barras correspondem a frequência variável e são calculadas pela área da barra é possível concluir que quando as famílias urbanas atingem o nível maior de salário a variância se mantém constante para o tamanho da família nos intervalos 3.0 a 3.2, porém é possível concluir também que a população que apresenta o tamanho de família entre os intervalos 2.6 a 2.8 e superior a 3.2 apresentam uma constância quando se diz respeito ao salário. Legenda: Histograma da População Rural É possível concluir pelo histograma que a população rural que apresenta um salário superior mantém uma constância em relação ao tamanho da família entre os intervalos 3 .1 e 3.2, no entanto com um salário inferior pode-se notar também uma constância em relação ao tamanho da família entre os intervalos 3.4 e 3.7.

Legenda: Histograma População Total Dessa forma, é possível concluir que famílias que apresentam um salário superior apresentam uma frequência constante de tamanho entre os intervalos 3.0 e 3.1, já em relação ao salário inferior, reduzido a metade apresentam uma frequência diversificada em relação ao tamanho da família, intercalando entre os intervalos 2. e 2.9 e entre os intervalos 3.1 e 3.3. Código da questão 02 library(readxl) tabela6971 <- read_excel("tabela6971.xlsx", col_types = c("text", "text", "text", "numeric", "numeric", "numeric")) legendaPOP <- paste(colnames(tabela6971$...3), tabela6971$...3) pie(tabela6971$Urbana, labels = legendaPOP, main = "Popução Urbana") pie(tabela6971$Rural, labels = legendaPOP, main = "Popução Rural") pie(tabela6971$Total, labels = legendaPOP, main = "Popução Total") library(readxl) tabela6971 <- read_excel("tabela6971.xlsx", sheet = "familias percentual", col_types = c("text", "text", "text", "numeric", "numeric", "numeric")) install.packages(ggplot2) library(ggplot2) graf_disp <- ggplot(tabela6971, aes(x = ...3, y = Urbana))+ geom_point(aes(col=("Urbana")))+ labs( y = "Numero de Familias", x = "Base Salarial", color = "Localidade") plot(graf_disp) graf_disp2 <- graf_disp +labs( y = "Numero de Familias", x = "Base Salarial", color = "Localidade")+ geom_point(aes(y= Rural, col=("Rural"))) plot(graf_disp2) library(readxl)